信息化建设解决方案之运维篇
信息化建设解决方案之运维篇
1、组织IT运维效劳面临的问题
【导读】随着组织信息化建设的不断深入,信息化的重点从IT建设转向IT运维,IT运维难度不断增加、IT运维本钱不断上升、IT运维效劳水平参差不齐、突发事件频繁发生给IT管理者造成了一定的困扰,那么根源是什么?
1.1 IT运维效劳面临的困惑
随着IT建设的不断深入和完善,计算机硬软件系统的运行维护已经成为了各行各业各单位领导和信息效劳部门普遍关注和不堪重负的问题,据统计,IT运维效劳占到IT部门工作量的80%左右。国内企事业单位的IT运维普遍存在以下现象:
〔1〕IT运维工作忙而不受重视。
IT运维效劳人职工作的一个普遍现象是“很忙碌,坐不下〞,每个IT运维效劳人员都很忙碌,到处在各个业务部门间解决和处理问题,就像“救火员〞。虽然如此忙碌,但业务人员还是经常抱怨“找不到人〞、“解决问题太慢〞等等。IT运维效劳人员的工作始终得不到业务部门的认可,而且工作量也难以量化。运维或信息部门作为单位的业务支撑部门,在信息系统的战略规划工程立项等工作中话语权较弱,更谈不上决策权,往往是工程建设完成之后才介入系统的管理和维护,等到发现问题为时已晚。
〔2〕IT系统复杂,维护难度高,风险压力大。
随着组织信息化的不断投入,组织的硬件设施、软件系统不断增加,软硬件设备的增加在一定程度上增加IT运维的复杂性,包括各类开发系统、各类应用架构、不同品牌厂商设备等等,需要不断增加人力投入,IT运维本钱居高不下。对业务连续性要求较高的单位,系统一旦宕机损失是巨大的,运维部门压力可想而知。有的单位由于缺乏系统的资产管理,运维部门很难准确了解公司到底有多少IT资产,公司是否需要购置新机也缺少数据支撑。在年底审计时全团队奋战多日才能完成单位的IT资产清查工作,然而来年又会因为设备报废,或职工离职而发生很多变化,还是无法做到实时掌握准确数据。
〔3〕技术人员难培养,流动性大。
大多数时候,运维人员都在进行着简单重复的工作,且很难得到最终用户的肯定,他们私下用“碌碌无为〞、“穷忙族〞来形容自己,人心松散,自我认可度低,团队人员流动率较大。 情况往往是某人好不容易成为熟练工了,却因为看不到职业前景或感觉不受重视而提出辞职。这些中坚力量的离职,会造成客户满意度和运维质量相当长一段时间内出现波动。
〔4〕效劳商难管理,技术水平参差不齐,效劳不及时,有问题不能及时解决。 IT运维效劳外包存在一定风险,关键在于对于IT运维效劳外包供给商的管理不到位,具体表达在招标环节疏于审查、过程监督环节疏于监管、以及事后评价环节疏于考核。通过在招标环节加强对供给商资质、能力水平、案例等考察可以有效包括准入关;通过在效劳过程中加强监督可及时发现供给商效劳提供能力的异常;通过事后评价可以建立供给商的退出机制,保证供给商提供优秀的效劳。
1.2 IT运维效劳问题分析
从以上现象可以看出,IT运维效劳的所有问题的根源都不是技术问题,而是管理问题,包括流程管理的问题、评价管理的问题、应急管理的问题等等。主要包括:
〔1〕IT运维效劳管理方式缺乏创新。
IT 运维效劳管理方式包括自营管理和外包管理,随着IT系统复杂程度的增加,对于IT运维能力的要求也越来越高,自营效劳的本钱已远远大于外包效劳的本钱,在某些非关键的领域,应该引入IT运维效劳外包这一创新管理模式以降低效劳本钱,同时将组织自身的IT运维人员解放出来,做更有价值和意义的工作。
〔2〕IT运维效劳管理不标准。
IT运维效劳人员很忙碌却得不到业务部门认可的根本原因是双方缺少IT运维效劳沟通的根本语言,也就是IT运维效劳管理标准不明确,导致业务部门对于IT运维效劳部门提供哪些效劳不清晰、提供效劳的流程不清晰、对于效劳的评价指标不清晰,同时也导致IT运维效劳人职工作职责不清晰、人员间工作交接不顺畅、效劳过程缺少监督等。
〔3〕工作分工设计不合理,无视梯队建设。
人员管理问题,根源在于运维工作分配不合理,业绩无法考核。假设将运维人员分成一、二、三线支持,不同运维人员各司其职,能使有限的运维力量得到合理利用,整体工作效率将明显提升;同时也方便对各自的工作业绩进行评估。再据此制定相应奖惩措施,或针对不同岗位提供不同效劳技能培训,亦能提高职工工作积极性。同时,加强运维团队内部知识系统的建设,有利于沉淀内部知识积累,快速培训新职工,减少核心职工离职带来的冲击。
〔4〕IT运维效劳供给商管理不到位。
IT运维效劳外包存在一定风险,关键在于对于IT运维效劳外包供给商的管理不到位,具体表达在招标环节疏于审查、过程监督环节疏于监管、以及事后评价环节疏于考核。通过在招标环节加强对供给商资质、能力水平、案例等考察可以有效的对供给商的资格进行把关;通过在效劳过程中加强监督可及时发现供给商效劳提供能力的异常;通过事后评价可以建立供给商的退出机制,保证供给商提供优秀的效劳。
2、科学的IT运维效劳管理之道
【导读】解决IT运维效劳问题,需要借鉴国内外优秀企事业的最正确实践,建立适合自身的IT运维效劳管理体系,并引入IT外包等先进管理模式,来解决IT运维效劳能力、质量、水平、本钱之间的矛盾。
2.1 IT运维效劳管理概述
根据国家标准GB/T 28827,IT运维效劳定义为:采用信息技术效劳和手段,依据需求提供的效劳级别要求,对其所使用的信息系统运行环境、业务系统等提供的综合效劳。
IT运维效劳包括自有运维、外包运维、自有与外包相结合的方式。下面将对两种不同模式下的管理进行阐述。
2.2 基于最正确实践的IT运维管理
2.2.1 ITIL概述
IT运维管理作为IT效劳管理的主要范畴,目前国际上的研究和论证比拟成熟,主要成果包括ISO20000系列的国际标准以及ITIL最正确实践方法论,两者从理论根底上是一致的,区别在于标准和标准的实践。下面以ITIL为例介绍IT运维管理的最正确实践。
ITIL(IT Infrastructure Library)诞生于1980年, 由英国政府发起, 委托CCTA(Central Computer and Telecommunications Agency)组织, 后成立 OGC(Office of Government Commerce)专门负责英国政府和其它公共事业组织对 IT资源的有效及低本钱利用。目前ITIL已经成为IT行业效劳管理的理论根底。在此根底上建立的非赢利性ITSM论坛(itSMF-IT Service Management Forum)已成为公认的ITSM的权威性社区。
ITIL 是基于流程的方法论。IT部门可用其检查是否用一种可控的和训练有素的方法为最终用户交付所需的IT效劳。ITIL合并了一套最正确的实践惯例,可适用于几乎所有IT组织, 无论其规模大小, 或采取何种技术。ITIL被用来建立和交付效劳管理流程;这些管理任务可被某些效劳及系统管理工具所简化。
ITIL对IT效劳管理实践中涉及的许多重要问题进行了系统的分析, 包括全面的检查清单(checklist)、任务、程序、责任等与任何IT效劳组织密切相关的问题。这些概念的定义也涵盖了大多数IT效劳组织的主要行为。IT效劳组织可以借助ITIL的指导建立和拓展自己的IT效劳流程。
ITIL V3的核心设施是基于效劳生命周期的, 效劳生命周期框架下列图所示, 效劳战略是生命周期运转的轴心;效劳设计、效劳转换和效劳运营是实施阶段;效劳改良那么在于对效劳的定位,基于战略目标对有关的进程和工程的优化改良。
2.2.2 ITIL五大模块
ITIL V3包含的各模块内容如下: 〔1〕效劳战略(Service Strategy)
效劳战略为组织在设计、开发和实施效劳管理从组织能力和战略资产两个战略角度来提供指
导。该局部内容提出了效劳管理实践过程中整个效劳生命周期的策略、指南和过程。效劳战略是效劳设计、效劳转换、效劳运营和效劳改良的根底,它的主题包括了市场开发、、内部和外部的效劳提供、效劳资产、效劳目录,以及整个效劳生命周期过程中战略的实施。
〔2〕效劳设计(Service Design)
效劳设计描述了对效劳及效劳管理过程设计和开发的知道,它包括将战略目标转变成效劳投资组合和效劳资产的原那么和方法,效劳设计的范围不仅限于新的效劳,它还包括为保持和增加客户价值而实行效劳生命周期过程中必要的变更和改良,效劳的连续性,效劳水平的满足,以及对标准,规那么的遵从性。它指导组织如何开发设计效劳管理的能力。
〔3〕效劳转换(Service Transition)
效劳转换为如何将新的或变更的效劳转换到运营过程中有关能力的开发和改良的指导,效劳战略需求通过效劳设计进行编码,而效劳转换那么是探讨如何将这种编码有效导入到效劳运营的体系中,与此同时,还应控制失败的风险和效劳的中断。
〔4〕效劳运营〔Service Operation〕
效劳运营包含了在效劳运营方面的实践,它对如何到达效劳支持和交付的效果与效率,确保客户与效劳供给商的价值提供了指导,并最终通过效劳运营实现战略目标。
〔5〕持续效劳改良〔Continual Service Improvement〕
效劳改良为创造和保持客户价值而用更优化的效劳设计、转换和运营提供指导。它结合了质量管理、变更管理和能力改良方面的原那么、实践和方法。组织要学会在效劳质量、运营效率和业务连续性方面的不断提高和改良意识。此外,它还为改良所取得的成就与效劳战略、效劳设计和效劳转换之间如何建立关联提供指导,为基于戴明环〔PDCA〕形成方案性变更的闭环反响系统的建立提供思路。
2.2.3 ITIL关键流程
在IT运维效劳体系中,ITIL是一套基于流程的方法和规那么。在组织信息化建设中,ITIL可以指导信息化部门向用户提供更为高效可靠的效劳。下面对这些关键流程进行简要的介绍。
〔1〕效劳台
效劳台是用户与IT部门进行沟通的唯一平台。效劳台为用户提供了效劳联系点,利用这个联系点促进组织业务流程与效劳管理根底架构的集成。效劳台的主要设计目标是加强用户与IT效劳部门之间沟通,为组织的信息化建设效劳。
〔2〕事件与故障管理
事件与故障管理的主要功能包括对事件与故障进行记录,分类,并安排专家管理故障处理的全过程。事件与故障管理的目标是在防止影响客户和用户业务的前提下让IT系统能够迅速恢复到平安级别。
〔3〕问题管理
问题管理流程是指通过事件发生的原因进行分析,制定问题的解决方案以及预防措施,降低因问题和事件而产生的消极影响。与故障管理单纯强调故障的处理速度不同,问题管理模块的核心功能是找到事件发生的深层次原因,并相应的提出合理的解决方案防止问题的再次发生。
〔4〕配置管理
配置管理模块负责识别和确认系统配置项、记录和报告配置项状态和变更请求、检验配置项的正确性和完整性等活动。设置配置管理的主要目的在于为组织提供IT根底架构的逻辑模型,对变更管理和发布管理提供有效的支持。
〔5〕变更管理
变更管理是在最短的时间内完成系统架构,并在效劳的任一方面发生变更时对其进行控制的效劳管理流程。该模块的设计目标是确保在变更实施过程中使用标准的方法体系并提高变更的效率,并降低由业务变更导致的业务中断对组织产生的影响。
〔6〕发布管理
发布管理流程负责对经过测试后导入实际应用的新增或修改的配置项进行分发和宣传。发布管理之前进行的是软件的控制和分发,该过程由变更管理流程进行管理。
〔7〕效劳级别的管理
该项管理的目的在于为签订效劳级别的协议而进行一系列活动所组成的效劳管理流程,其中主要的活动包括协议的方案、草拟、以及签订效劳级别等方面。有效的效劳级别管理可以保证IT效劳质量在不提高本钱的前提下能够稳步提高。
〔8〕IT效劳财务管理
IT效劳财务管理模块主要是指IT效劳过程中所需的本钱进行预算和核算,根据预算情况向客户收取相应的费用。所涉及的费用主要包括投资预算、效劳本钱的核算以及效劳计费三局部。合理的财务管理以及计费方法可以通过量化效劳本钱降低开销,防止风险的发生并引导客户的合理行为。财务管理流程产生的预算和核算信息可以为IT效劳提供有效的辅助决策信息。
〔9〕IT效劳持续性管理
IT效劳持续性管理指当系统发生故障时有可靠的技术、财务和管理资源保证组织的IT效劳能够正常运行。保持IT效劳持续性的关键在于当故障发生时,系统仍可以提供预定级别的效劳,从而确保系统的业务可以稳定持续的运行。
〔10〕能力管理
能力管理既考虑运营本钱也考虑业务需求,对效劳能力进行合理配置从而到达IT资源发挥最大效能的目的。该流程包括效劳能力管理、业务能力管理和资源能力管理等方面。
〔11〕可用性管理
可用性管理流程通过分析用户和业务方的可用性需求并以此为依据来优化和设计IT根底架构的可用性,有效的可用性管理可以在控制本钱的前提下提高系统的可用性。有效的可用性管理可以通过定位业务以及对用户的可用性需求进行分析,从而使IT效劳的设计能够满足用户的需求,并且可以防止IT效劳运作中可用性级别过高的情况发生,这一设计思想对于降低IT效劳的运作本钱具有重要意义。
2.3 风险可控的IT运维效劳外包
IT外包是指组织为了实现自己的目标, 通过合同或协议的方式将局部或全部的信息技术职能交由外部的效劳提供商提供的一种管理模式。IT外包一般还伴随着组织的IT 资产、人员、租
赁资产交由IT 效劳商管理。
选择IT外包有以下好处:专业公司提供的外包效劳,比组织自身效劳部门的工作更为高效、专业;利用第三方的资源和技术优势,降低组织管理与运行本钱;组织自身那么集中精力开展其核心业务,增强核心竞争力;以组织业务特点定制的解决方案,完全人性化的集成及效劳;单一的联系点,全面支持客户众多品牌的软硬件产品,防止多厂商IT设备条件下的协调本钱等。
2.3.1 IT运维效劳外包的根本阶段
对于外包的客户方组织而言,要成功实施 IT 外包效劳,主要经过以下几个阶段: 〔1〕组织的内局部析和评估〔准备阶段〕
在这一阶段,组织的高层管理者主要工作是确定外包的需求并制定实施的策略。要从外包中获得效益,组织的最高决策层必须采取主动的态度,因为只有最高决策层才具有外包成功所必需的视角和推动变革的力量。
〔2〕选择适宜的外包商〔选择阶段〕
在选择外包商时,要先将自己要求的底线与外包商所能提供的效劳进行比拟。通过识别潜在的外包商,向外包商发布信息并邀请竞标,接收和分析外包商的标书,审阅外包商的证明文件,验证他们在提供外包效劳上的经验与能力,甄选最终外包商并进行合同谈判。
〔3〕完成内部效劳向外包效劳的过渡〔过渡阶段〕
该阶段涉及到人事过渡、资源移交、工作场所变更、系统切换等过程。 〔4〕外包的实施和管理阶段〔整合阶段〕
这一阶段对外包关系进行管理,并就任何外包关系的维护与变化进行协商或者谈判,加以实施。客户在这一阶段要保持对外包业务性能的随时监测和评估,并及时与外包商交换意见,保证外包工作的顺利进行。
2.3.2 IT运维效劳外包风险管理
IT外包风险是由许多不确定因素造成的。其中可能涉及配合外包效劳提供商的需求进行一些额外工作,包括协调本钱、签约金和监督外包商进展的支出,这些可能导致实际本钱远高于预期本钱。另外,还有一些合同风险——在与外包效劳提供商订立合同时,如果条款说明不明确或者漏掉重要条款,都可能会让组织遭受极大的损失。
由于外包必然会涉及风险,因而在外包决策前必须对风险进行管理,进行风险评估,要区分、分析风险并按照优先次序对其进行排序,考虑如何才能消除或减小风险,同时还要考虑在外包协议生效期间产生的管理费用。
IT外包风险管理是指根据信息资源对于组织的价值,对风险进行预测、识别、评估、分析,识别、评价组织的信息资源的威胁和脆弱性,并在此根底上有效地处置风险,从而使风险到达可接受的水平。主要包括以下几个步骤:
风险识别:识别和评估潜在的风险领域 风险分析:分析外包关系可能会产生的风险 风险排序:对风险的优先级进行排序
风险控制:考虑采用什么样的方法对它们进行管理与控制。
2.3.3 IT运维效劳外包合同管理
外包合同管理是外包效劳管理的一个重要组成局部。由于外包工程经常涉及到的交易金额庞大,而且外包效劳对于组织的高效运营非常关键,因此需要专业的法律文件支撑。合同应该灵活而又能够解决交易中真正问题,使客户和外包商双方均受到保护,能
对价值的创造和风险的管理起到支持作用。
外包效劳合同包括效劳水平协议(SLA - Service Level Agreement)。外包合同一般为 5 年、10年。合同条款是外包效劳中最重要的环节,合同条款制定的详细程度和明确性直接影响合同的履行。合同条款涵盖的内容非常全面,包括:合同的适用范围和预期客户资源需求、合同条件、基准及衡量方法、有效期、终止原因、知识产权、合同转让、关键工程实施人员及补救方法、未来价格灵活性、未来效劳的灵活性、付款方式和时间、风险管理以及其它法律规定的合同必备条款。好的外包合同条款对合同中的工作有清楚的界定,能够在双方出现分歧时成为解决争端的依据。
2.3.4 IT运维效劳外包关系管理
在IT 效劳外包中,合同是要求双方履行承诺的主要约束力。然而仅靠合同并不能保证外包的成功。由于外包合同在多数情况下是不完善的,合同是逐步实施并且不断变化的,所以在合同中不可能对外包效劳需求的所有环节都做出具体的规定,如果客户在外包职能范围内出现新的需求,而且需求在合同中没有做出具体规定,就无法靠合同解决。
在这种关系下,客户方需要与外包商建立起相互协作和相互理解的关系,这样外包商才会对变化与额外的需求做出善意反响。因此,外包商和客户之间的稳固关系显然是长期业务外包关系成功的关键,也是解决外包中分歧的有效方法。
要正确维系与外包商之间的关系,需要进行关系管理。外包关系管理是指一整套能够使外包关系运营的人事、流程、工具和系统。外包关系管理是组织确保实现合同价值的最重要的工作。
实践经验显示,成功实施外包关系管理的组织通常非常关注以下几个关键成功因素: 〔1〕双方协商的、可测量和可检验的客观绩效标准
成功的外包关系焦点在结果而不在手段。需要制定客观的绩效度量标准,能够保证结果的可度量性。只有通过与绩效的客观标准相比拟,顾客才知道他们正在接受的效劳正是期望获得的效劳,外包商才知道他们正在满足顾客期望的需求。
〔2〕正式的关系管理结构
正式的、多层次的关系管理结构可以将客户和外包商连在一起。外包关系要求用它自己的管理结构去替代以前内部的管理系统,这种新型结构通常采用联合管理团队的形式。管理团队或大型合同的多个管理团队负责日常的、战术和战略方面的关系管理。每个团队的职责、议程、会议频度以及与其他团队的关系都有明确的界定。这种关系管理结构建立起识别、解决问题的重要机制,能够实现问题的及时上报、处理和解决。
〔3〕基于绩效的定价标准
基于绩效的定价可以确保不断地鼓励外包商去到达或超越设定的绩效标准。当绩效超过标准时,就给予奖励;当绩效低于标准时,就给予处分。对处于外包关系中的双方的职工来说,这些鼓励也可转化为绩效标准。把所有的基于绩效的风险和收益转换成个人的绩效标准时有利于双方
关注焦点的适当调整。
〔4〕关于商业目标和关系管理的内部培训及交流
负责为顾客管理外包关系的职工应接受专门的职业培训,包括全面理解合同的商业目标,双方认可的具体的绩效标准,以及他们个人的角色、职责、权力和报告结构。此外,最终用户也应该接受适当的培训,以理解商业的总体目标、问题的识别和解决方式、沟通的渠道等。培训和交流也可以减少客户可能存在的不满或抵抗情绪。
〔5〕知识和技能持续不断的交流
两个组织之间持续不断的、自由的知识和技能的交流是成功的外包管理的标志。每方都有他们自己的特长,当这些特长被共享时,它不仅对双方关系的成功有所奉献,而且对己方的成功也有所奉献。培训方案、岗位经验、与专家交流、技术和工序都是有助于实现交流的具体方式。
3、MaxValue IT运维效劳
【导读】作为专业的IT运维效劳供给商,我们向客户提供包括咨询、效劳外包、工具一系列的IT运维效劳,帮助客户实现IT运维的高效管理。
3.1 MaxValue IT运维效劳总体框架
完整的IT运维效劳框架包括管理咨询、外包效劳以及工具效劳,以IT运维咨询效劳为先导进行顶层设计,标准组织内部IT运维和IT外包业务;以IT运维外包为过程环节,实现IT运维的专业化和高效化;以IT运维效劳工具为支撑,实现流程的固化和实时监测,提高IT运维效劳的效率。总体框架图如下:
3.2 MaxValue IT运维效劳内容
针对客户的实际需要,我们将提供如下效劳工程:
3.2.1 IT运维管理咨询效劳
IT运维管理咨询效劳就是以IT治理思想为指导,以推动IT与业务的动态融合为出发点,基于ITIL最正确实践经验,为客户建设以效劳为导向的IT运维管理体系;帮助制定标准化的ITIL效劳流程,建立信息部门和业务部门之间沟通的桥梁,辅助信息部门选择或开发标准化的日常管理工具。
具体内容包括:
IT运维现状评估:通过现状、访谈、研讨等形式了解客户IT运维现状,并基于ISO20000体系进行评估;
IT运维体系设计:基于ITIL最正确实践,搭建组织IT运维组织职能和流程; IT效劳外包管控设计:设计IT效劳外包的管理体系。
通过咨询,帮助企业梳理现有的IT运维业务流程,建立基于ITIL最正确实践的运维流程和组织职能,通过引入效劳台、效劳水平管理等最正确实践,有效提高IT部门对业务需求的响应速度,建立IT与业务的沟通“语言〞和沟通桥梁,平衡IT与业务的关系,平衡IT效劳质量与效劳水平,提高业务满意度,提高IT资产价值利用率。
3.2.2 IT运维效劳外包效劳
针对IT运维工作量大,技术繁琐,专业性高等特点,提供专业的基于IT全生命管理工具平台的MaxValue IT运维外包效劳,帮助用户实现以花费更少、历时更短、风险更小、更为专业的效劳维护信息技术应用。
桌面管理效劳
帮助用户解决桌面级管理运维工作繁锁且占用大量工作时间的困惑,提供根底档案维护、软件维护及设施维护等专业运维效劳,专业的人做专业的事,更迅速,效率更高,使组织总本钱更节省。
根底设施维护
提供根底设施相关的档案、物理环境、计算机网络的运维以及应急救援效劳,保证用户现有根底设施正常运行,降低整体管理本钱,同时根据日常维护的数据和记录,提供用户根底设施整体建设规划和建议,更好地为用户信息化开展提供有力保障。
系统软件维护
提供系统软件相关档案、主机存储设备、应用软件、系统数据的运维以及应急救援效劳,保障用户系统软件正常运行,降低整体管理本钱。同时,协调各业务应用系统内部运作,提高系统可用性。
信息平安维护
提供信息平安相关档案维护、监测预警、风险评估、平安加固、应急救援的运维以及信息平安意识培训效劳,及时掌握网络平安系统资源现状和配置信息,全面提高系统信息平安性。
3.2.3 IT运维应急救援效劳
针对机房中物理设备、计算机网络设备、效劳器存储设备、应用软件系统突发的重大事件,包括信息平安事件,以最快的时间进行故障排查定位和应急处理,帮助客户实现事件发生后控制事态,限制影响,防止或减少次生灾害的发生。
主要内容包括:
根底设施应急救援:包括网络故障、设备宕机等故障救援 软件系统应急救援:包括系统不可用、系统性能差等故障救援
信息平安应急救援:包括网络受攻击、病毒攻击、系统被篡改、泄密等故障救援。
3.2.4 IT运维效劳辅助工具
MaxValue IT 全生命周期管理平台作为运维效劳辅助工具,具有全面的运维监控分析管理功能,全面覆盖IT运维工作的各个阶段。
运维信息收集
IT全生命周期管理平台的机房中心、监控中心、网络中心、平安中心能够全面收集运维过程中出现的各种事件、告警、问题、变更等信息。能够全面地收集各种资产的监控指标,并根据客户实际业务系统整合监控指标和组合算法进行核心业务的监控。将系统的可用性、性能情况、容量估算等可视化数据实时推送到用户端。
统一分析和告警机制
系统采用统一的事件分析规那么引擎。事件综合分析包括事件关联分析、逻辑关联分析、影响范围分析等手段,根据事件的影响范围、破坏性、可恢复性等风险评估结果对事件进行分级,根据分级结果对事件进行处理。
运维管理
运维中心是运维系统的管理平台。系统采用全球IT运维最正确实践的ITIL作为管理流程设计的依据。运维中心包括效劳台、效劳级别管理、事件管理、问题管理、配置管理、变更管理、发布管理、日常运维管理等功能模块,全面覆盖运维管理的整个过程。
报表和展示
报表中心能够对 IT 系统运行状况信息进行汇总,并以图表的方式为管理人员提供直观的分析结果,帮助更全面的了解网络、主机、数据库、应用系统的运行状况和运行趋势,为决策提供支持信息。报表支持多种格式的导出与自动发送功能,根据不同角色人员的需要,灵活定制报表的内容和格式。
展示方面系统支持PORTAL平台形式的可定制首页功能, 更能支持 、PAD等终端的访问,支持大屏幕的展示。
辅助运维工具
资产管理。资产管理问题是IT运维工作的核心问题。IT全生命周期管理平台提供全面的IT资产管理解决方案,能够对资产的购进、使用、变更、处置等全生命周期进行管理 。
运维知识库。运维效劳人员处理问题的工具库。系统提供的运维知识系统,不仅能够帮助运维运维查询知识解决一线支持问题,还能够培训考核新职工,加强内部交流。运维知识系统能够提高问题解决效率,降低运维人员的工作强度,提高效劳满意度。
MaxValue IT全生命周期管理平台架构图
4、最正确实践介绍
【导读】针对IT运维效劳管理,国内外的大量实践已经为我们提供了优秀的经验。
4.1 借助第三方咨询力量可有效实现IT运维效劳管理最正确实践落地
很多客户都希望加强自身内部的IT运维效劳管理或者加强对IT外部效劳的管控,但是苦于没有经验,在实际建设过程中出现设计不完善、不能落地的现象。
实践证明,通过引入第三方咨询效劳可以有效解决此问题。第三方咨询效劳依靠大量的效劳实践和成熟的实施方法论,可以帮助客户在最短时间内实现适合客户自身特点的IT运维效劳管理体系的设计,并能辅导客户实现管理体系与日常管理的有效融合,帮助客户最大程度上发挥最正确实践的成效。
4.2 IT运维效劳外包可实现IT运维本钱与质量的平衡
在IT运维效劳过程中,很困扰客户的一个问题就是业务对于IT运维效劳质量的要求与IT运维效劳能力和效劳本钱间的矛盾。伴随着组织IT系统复杂程度的不断增加,为保证IT运维效劳质量,IT运维效劳本钱激增,如何来解决?
通过引入IT运维效劳外包,将局部或全部IT运维效劳交付给专业的第三方IT运维效劳提供商,可有效解决IT运维本钱与运维质量的矛盾。
选择IT外包有以下好处:专业公司提供的外包效劳,比组织自身效劳部门的工作更为高效、专业;利用第三方的资源和技术优势,降低组织管理与运行本钱;组织自身那么集中精力开展其核心业务,增强核心竞争力。
4.3 应用自动化巡检工具能够降低运维工作强度,提高巡检效率
信息系统的运维工作,涉及对网络、业务应用、桌面、平安、告警、运维效劳模块等上百个指标的检查,对于这些指标的检查如果通过人工巡检的方式进行,巡检效率低,并且可能出现漏检、重检的情况。
自动巡检时,巡检中心按照巡检表要求定时启动巡检;巡检指令由适配器接收并执行,并将检查结果反响到巡检中心;巡检中心实时展现当前巡检过程执行情况,发现异常情况即以工单、告警等方式及时通知给应急维护人员;针对每次巡检过程,能够自动产生巡检结果报告。对于所有历史巡检结果报告,支持按照多种查询条件进行快速检索。自动巡检系统还能够根据设定,定期自动产生统计分析和趋势分析报告,支持高层领导决策。
相对于人工巡检,自动巡检系统由中心和适配器分工协作实现自动巡检。运维中心负责执行巡检方案、分发指令、人机交互等;适配器通过调用资产数据接口或执行命令脚本,实现对资产信息状况的检查。自动巡检很好的解决了上述这些问题,是运维巡检的最正确实践之一。
4.4 应用效劳水平协议有助于提升效劳质量和效劳认可度
效劳水平协议〔Service Level Agreement,SLA〕是一种由效劳供给商与用户签署的法律文件,其中承诺只要用户向效劳供给商支付相应费用,就应享受到效劳供给商提供的相应效劳质量,是定义效劳提供者和用户之间关系的一个文件。
效劳水平协议内容一般包括提供的效劳、效劳水平、问题管理、法律适用和解决争端、客户的义务和责任、平安、知识产权和机密资料等。
有效的应用效劳水平协议,将有助于确定并界定用户需求、提供便于理解的框架、简化复杂问题、减少冲突范围、在发生争议时加强对话、消除双方不切实际的期望等。效劳水平协议将建立效劳双方共同的愿景和考量标准,实现对效劳水平的统一理解,有助于改善效劳接收方对效劳提供方效劳水平和效劳质量的认可度。
4.5 持续监测有助于防患于未然,降低IT故障发生几率
持续监测就是通过部署监测工具对IT系统的关键指标进行7*24小时不间断的监测,一旦指标出现异常,将自动通过邮件、短信等方式提醒IT运维效劳人员进行关注并分析。
通过持续监测IT系统的关键指标,IT运维效劳人员可以在故障发生前提前介入并进行调查分析,并将故障在萌芽阶段予以排除,实现提前预警、提前处理,防止故障发生给业务造成的影响,降低客户损失,提高IT系统的可用性。
4.6 定期巡检是一种比拟经济的故障预防手段
由于持续监测需要部署专业工具,还需要IT运维人员24小时的驻场效劳,总体投资比拟大,对于可用性要求比拟高的IT系统是必须的。如果客户所应用的IT系统并不要求非常高的可用性,持续监测这种效劳方式就显得昂贵了,此时采用定期巡检的方式不失为一个好的选择。
定期巡检就是周期性地对IT系统进行一次全面的健康检查,周期的频率取决于客户对于IT系统可用性的要求。定期巡检的检查工程与持续巡检检查工程一致,通过规定工程的定期检查和
日志分析,可以判断IT系统的健康状况,查找系统漏洞和平安隐患,并采取措施进行加固。由于定期巡检不需要一次性的工具和人员投入,也能取得较好的故障预防效果,是一种投入产出比拟高的故障预防手段。
4.7 配置管理数据库是IT运维管理工作的根底
配置管理数据库〔Configuration Management Database,CMDB〕是用于存储配置项及配置项关系的数据库。在数据库中,配置项及其关系利用关系数据库的方式对客户IT效劳的整体架构进行了描述,包括IT效劳、IT根底设施、IT应用系统、IT人员、IT文档等。
配置管理数据库是IT运维效劳工作开展的根底。通过配置项的上下级关系将帮助IT运维人员实现由故障点上下快速定位;通过配置项的横向关系将帮助IT运维人员实现故障影响范围的快速确定;通过配置项的属性信息实现配置项关键信息的信息存储和检索。总的来说,配置管理数据库是IT运维效劳工作快速、高效、准确的利器。
4.8 运维知识库能够加强知识积累和内部交流,提升效率
运维知识库是系统知识积累的重要方式,是职工日常工作的重要工具。通过对知识库维护和使用,不仅可以在故障自动处理和人工处理的过程中从知识库中得到相关故障维护的分类和快速定位,找到匹配的处理案例,便于处理人进行借鉴,而且知识库具有的业务帮助功能,能使相关人员可以通过关键字查询业务帮助、产品、市场活动、发生过的处理流程、电子文档等。
运维知识库一般具有的功能有知识的录入和查询、知识的分类展示、知识的转移和版本管理。知识的录入一般支持多种方式,手工录入、模版导入、批量导入、事件关联等。在知识查询上一般支持多种搜索方式,关键字搜索、条件搜索、高级搜索、附件全文检索等。版本管理能够管理不同版本的知识,做到知识可追溯,修改有依据。
运维知识库系统还能具备个人知识的学习、职工的在线培训和考试、知识问答等功能,提升运维工作的支持效率,加强了内部交流和知识积累。
因篇幅问题不能全部显示,请点此查看更多更全内容