打造高效的制造业IT运维系统
发布日期:2020-12-04 17:36 浏览次数: 次
制造业是指对制造资源,包括物料、能源、设备、工具、资金、技术、信息和人力等,按照市场要求,通过加工制造过程将制造资源转化为可供人们使用和利用的工业品与生活消费品的行业。简单来说,制造业涉及从原材料采购到产品生产和销售等进销存各个环节,复杂的生产加工流程使得制造业对信息化系统依赖很深。但由于种种原因,一直以来制造企业并没有最大程度发挥信息化的价值,很多企业由于对自身特点认识不足以致企业信息化战略没有一个长远的规划,IT系统与业务结合不够紧密,随着企业规模的扩张以及业务需求日趋复杂,信息化显得累赘和笨拙,低效的信息化应用和持续高涨的信息化投入成为阻碍信息化在企业进一步推进的障碍。
与此同时,随着全球需求的萎缩以及企业经营成本的持续高涨,传统粗放型底附加值的生产经营方式已不能适应未来的市场发展需求,不断加快的市场竞争节奏以及个性化的市场需求,也驱使着企业缩短产品的研发周期并推出更具创新力的产品,要求制造企业打造更为灵活的IT系统以适应业务的调整需求。制造业转型成为下一个五年甚至十年的必然趋势。在这一过程中,IT运维作为提升企业信息化应用效率的手段之一,也越来越受到重视。
一、IT运维管理现状
IT运维管理是指企业IT部门采用相关方法、手段、技术、制度、流程和文档等,对IT软硬件运行环境、IT业务系统和IT运维人员进行综合管理,以最为有效的方式实现IT对于企业的价值。IT运维管理主要包括以下八个方面:
1、设备管理:对网络设备、服务器、操作系统运行状态进行监控和管理;
2、应用与服务管理:对应用软件及系统服务状态进行监控和管理;
3、灾备管理:对系统和业务数据进行统一存储、备份和恢复;
4、业务管理:对企业核心业务系统运行状态进行监控和管理;
5、目录和内容管理:对企业需要统一发布或因人定制的内容或公共信息进行管理;
6、资源资产管理:对IT系统中软硬件资源进行管理并实现与企业财务数据对接。
7、信息安全管理:主要依据ISO17799标准对企业安全组织方式、资产分类与控制、人员安全、物理与环境安全、通信与运营安全、访问控制以及业务连续性等进行管理。
8、日常工作管理:主要用于规范和明确运维人员的岗位职责,提供绩效考核量化依据,提供解决经验与知识的积累与共享手段。
IT运维管理涵盖了设备管理、业务管理、资源管理、安全管理以及人员管理在内的企业信息化应用的各个方面,通过对IT系统与业务系统运行状态的监控,企业管理者能及时的了解业务对IT资源的占用。通过自动化IT运维管理,企业能提升IT应用效率并降低IT成本投入。尽管如此,IT运维管理在制造业信息化过程中却未能得到充分的重视。
近十年来,中国制造业产值由全球第三跃居全球第一,中国制造业的飞速发展带来的是企业规模的不断扩张,随之而来的是产品生产结构越来越复杂,需要的信息支撑越来越多。由于缺乏整体的信息化规划,企业在实施信息化系统时考虑的是短期效益,信息系统数量增加的同时各系统之间的关联性却很松散,各系统之间的数据割裂形成了众多的信息孤单,很大程度上影响了企业运营效率。加之IT运维水平欠缺,制造企业一直在重复的IT成本投入和IT资源浪费中来回打转。
二、制造业IT运维痛点解析
1、IT运维人员成本偏高
e-works调查显示,近5年来,随着中国制造业信息化应用水平的提升,企业的信息化系统也越来越复杂,也越来越难以有效的管理。有过半的CIO认为,由于企业的IT运维自动化程度不高导致企业的IT运维成本居高不下。以华为为例,目前华为数据中心服务器虚拟化率已经达到75%,存储虚拟化率达到90%,通过实施虚拟化节省IT投资5000万元,但即便IT运维自动化程度很高,华为的IT运维成本也占IT总投资的40%。
同时, Gartner调查也显示,在IT运维成本中源自技术或产品(包括硬件、软件、网络等)成本其实只占20%,而流程维护成本占40%,运维人员成本占40%。流程维护成本包括日常维护、变更管理、测试成本等;人员成本包括训练、教育、人员流失、招聘成本等。
上图说明,设备投入成本和人员维护成本很大程度上决定了流程维护成本,并最终决定着IT运维成本。
2、救火式的IT运维
目前,企业IT运维过程中IT运维人员大多只是处在被动、低效率手工救火状态,只是在事件已经发生并造成业务影响时才能发现和处理,这种状态直接导致:
①IT运维人员终日忙碌,IT运维人员日常大部分时间和精力是处理一些简单重复的问题;
②IT运维本身质量很难提高;
③故障预警机制的不完善,往往是故障发生后或报警后才会进行处理,不但事倍功半而且故障还常常会出现恶性连锁反应;
④IT部门和业务部门对IT运维的服务满意度都不高。
3、自动化程度不高
目前,很多企业部署了比较简单的IT数据采集软件,能够获取IT设备、服务器、网络流量、数据库等状态信息,但很多信息只是简单的堆积在一起,没有一个可归类数据并实时分析或显示运行状态的可视平台,而且很多管理操作还处于手工阶段。即使一个简单的系统变更或更新都需要运维人员逐一登录每台设备进行手工操作,当设备数量达至成百上千时,工作量之大可想而知。而这样的变更和检查操作在IT运维中往往每天都在进行,占用了大量的运维资源。因此,提供企业的自动化运维水平已经迫在眉睫。
通常情况下,企业信息化系统运行状态就上图一样,所有信息(杂乱)都从各个地方被收集到了这个圆圈(容量不变)里面,信息进去后不能主动流出来。可能会出现的情况:这个圆圈容器装满后会爆破或是溢出来;圆圈的运行速度会慢慢降下来,从而导致信息输入的速度也会变慢。
三、打造高效的IT运维系统
(1)建立自动化运维管理平台
IT运维管理建设的第一步是要先建立IT运维的自动化监控和管理平台。通过监控工具实现对用户操作规范的约束和对IT资源进行实时监控,包括服务器、数据库、中间件、存储、网络、安全、机房、业务应用和客户端等,通过自动监控管理平台实现故障或问题综合处理和集中管理。例如,在自定义周期内进行自动触发完成对IT运维的例行巡检,形成检查报告。包括自动运行维护,以完成对系统补丁的同步分发与升级、数据备份、病毒查杀等工作。
(2)建立故障自动触发机制与流程
IT设备在遇到问题时会自动报警,无论是系统自动报警还是使用人员报的故障,应以红色标识显示在运维屏幕上。然后IT运维人员只需要按照相关知识库的数据,一步一步操作即可。因此,企业需要事先建立自动工单式流程管理,当设备或软件发生异常或超出预警指标时会触发相关的事件,同时触发相关工单处理流程给相关IT运维人员。IT运维人员必须在指定时间内完成流程所规定的环节与工作,以提高IT运维响应问题的效率。
(3)建立规范的事件跟踪流程
IT运维自动化管理建设时,首先需要建立故障和事件处理跟踪流程,利用表格工具等记录故障及其处理情况,以建立运维日志并定期回顾从中辨识和发现问题的线索和根源。事实上许多实践也证明,建立每种事件的规范化处理和跟踪指南,可以减少IT运维操作的随意性和强化运维的执行力度,在很大程度上可降低故障发生的概率。同时,用户还应可以通过自助服务台、电话服务台等随时追踪该故障请求的处理状态。
(4)设立IT运维关键流程,引入优先处理原则
设立IT运维关键流程,引入优先处理原则是指要求CIO定义出IT运维的每个关键流程,不仅仅是定义流程是什么,还包括要指出每个关键流程对企业有什么影响和意义。同时,在设置自动化流程时还需要引入优先处理原则,例行的事按常规处理,特别事件要按优先级次序处理,也就是把事件细分为例行事件和例外关键事件。
总之,实现IT运维的自动化管理是指通过将IT运维中日常的、大量的重复性工作自动化,把过去的手工执行转为自动化操作。自动化是IT运维工作的升华,IT运维自动化不单纯是一个维护过程,更是一个管理的提升过程,是IT运维的最高层次,也是未来的发展趋势。