x
企业级运维工作面临着技术路线、操作工具的选择等问亟待解决
来源:云呐 2021-11-25 11:23:26
  由于企业的发展,运维管理工作的工作量不断增加。企业级运维工作面临着技术路线、操作工具的选择等问亟待解决解决。

选择一个自动化的操作工具应考虑哪些因素?

  一、自动化操作工具,即行业内受众的成熟程度。可以从这一观点来评价,不管是商业还是开源;

  二、自动化操作工具功能能否满足操作人员的需求;

  三、如果选择开放源码的自动化操作工具,要考虑工具的技术组合与公司员工的技术堆栈是否匹配;

  四。自动化操作手段是否具备良好的安全保障;
运维管理系统
  自动化操作工具对主机在工作过程中性能的影响,尤其是在并发操作较大时,运维管理工具平台对服务器的压力;

  我们还应考虑所选择的自动化操作工具是否能满足公司随后技术栈的开发要求。

在此阶段,自动化操作软件能在多大程度上精确地找到故障

  一次小小的故障都会造成几十个甚至几百个设备的报警,那么当前的自动化操作软件能在多大程度上对故障进行精确定位呢?或只做提示,是否仍需要操作人员手工查找故障的真正原因?

利用机器学习中的二叉树决策树来实现故障精准定位算法

  首先,我们希望能把所有发生故障的报警信息整合为一条信息,降低报警量。从而另一方面而言,希望可以智能化地精准定位故障点,降低工程师检查问题的时间,并引入自动化。本文以网络故障的原因精准定位为例,通过三步法达到上述目的:

  第一,将问题解决过程的经验分解成二叉决策树;

  然后,利用时间切片算法对报警信息进行归类和分组。

  数据包的报警信息最终输出到决策树,实现自动推理输出推理。

  智能化地精准定位故障点,降低人员的参与,提高了操作效率。

如何避免自动化操作的风险?权限怎样控制

  自动操作的一些可能的风险:

  (1)对自动化操作的账号权限设置管理是否合理,账号是否有权限限制,是否可以通过这个账号重新启动一些重要服务。

  (2)自动化操作的交互式界面,是否对诸如RM*等高风险操作进行了二次提示和密钥验证。

  (3)大规模变革需要通过自动化运营平台进行,是否有完善的审计系统?

  (4)自动化操作平台本身的程序版本和操作策略是否已经过备份和恢复验证。

部署和发布自动化过程是什么?

  自动部署,每个企业都不一样。现在,大部分企业仍然停留在应用部署阶段,业务停止级,也就是停止现有应用,重新部署。对先入为主的行业而言,业务场景要求业务不会受到干扰,大部分业务都会逐步发布或更新。以这种方式,回溯和影响所产生的影响将会比较小。

  自动化发布过程通常是开发环境发布——测试环境发布——生产预发布——产品发布代码管理——大多数情况下使用svn或git等统一的管理平台。

如何确保在人员不足时自动操作的可靠性?

  自动控制几乎不需要人工工作,这意味着它不仅能提高产量,还能让操作人员从复杂的传统维和工作中解脱出来,把他们的知识和技能运用到更重要的任务和任务中。另外,每天可管理的工作量由于降低周转时间而增加。

  操作过程中常常包括一些重复的但绝对必需的工作,这也是容易出错的原因。在这个过程中,由于人为因素的影响,代价高昂的人为错误会自然消失,这种错误对有多种操作系统的大网络尤其有用。自动操作能显著提高运行人员的可靠性,降低人工操作的繁重工作量。
  云呐致力于为企业公司、银行、政府 事业、学校教育类、医疗类、交通类、通信类等行业提供一站式数字化运维管理系统解决方案。
  云呐统一运维管理平台,通过对网络设备管理、资产管理、服务器管理、存储设备管理、业务应用管理、无线管理、日志分析、IP摄像头、办公设备/联网设备、动环系统等本地和异地网络的实时监控、自动巡检,精准采集、分析故障信息,判断重要数据性能指标,实现大规模数据中心的集中统一管理。如果对云呐统一运维管理平台有什么疑问,你可以联系在线客服,或直接注册免费试用云呐系统。



免费试用:点我开通试用

智能运维品牌

固定资产管理系统

申请体验,开启您的企业数字化

立即体验