网络工程师发表论文格式范文参考
所属栏目:计算机网络论文
发布时间:2013-12-13 15:58:33 更新时间:2013-12-13 15:01:32
IT服务管理(ITSM,ITServiceManagement)是以服务的形式为客户提供价值的一组特定的组织能力,用于向客户以服务的方式提供价值。其核心思想是IT组织的主要工作就是提供低成本、高质量的IT服务。这种IT服务是IT组织通过合适的人员、流程和信息技术来完成的,即IT服务管理的实施离不开三大要素:人、流程和技术。IT服务管理系统就是其中的技术要素,本质是通过系统的建设,实现IT服务管理流程的自动化、电子化并监测服务的质量。
【摘要】IT服务管理系统是IT服务管理的三大要素之一。随着云资源池的建设,原来的IT服务管理系统需要调整优化。在IT服务管理系统的现状诊断基础上,分析了云计算环境下资源池的建设和运营在流程支撑、资源动态调度、运行监控、容量管理等方面给原来的IT服务管理系统带来的挑战,优化了IT服务管理系统的功能架构,增强了系统能力,并提出分步实施的策略。
【关键词】IT服务管理,CMDB资源池
1IT服务管理系统现状
中国电信从2008年底开始制定中国电信服务体系并逐步推进,目前已经建设了集团和省公司两级的IT服务管理系统(简称ITSM系统),主要包括服务管理域、监视管理域和采集管理域的功能,其系统功能架构如图1所示:
(1)IT服务管理域功能:支持所有IT服务管理流程的管理功能,并提供服务流程全过程的实时监控、闭环管理和量化考核;同时,还实现IT资产及配置数据(CMDB,ConfigurationManagementDatabase)的存储、共享、访问和管理,为IT监控系统和相关的IT服务管理流程提供配置项信息及其关联关系的存储、分析、访问、同步的功能和数据管理功能。
(2)监视管理域功能主要包括以下三个层面的监控功能:
1)端到端的业务服务流程监控:主要以电信提供的业务服务视角作为监控的对象,如CMDB新装/退订/停复机服务的流程,提供业务全流程运行状态和质量情况监测,从而主动发现业务流程潜在的性能和可用性问题;
2)应用软件监控:实现应用软件(进程、进程池、接口和数据文件等)的监控管理,通过对应用软件的告警、性能、配置数据的集中采集、处理和展现,及时发现系统应用软件运行状态的异常;
3)IT基础设施监控:实现所有主机、操作系统、存储、备份、数据库、中间件、网络等IT基础设施的集中监控管理,结合CMDB中配置项以及配置项之间的关联关系信息,实现对MBOSS域IT基础设施的拓扑展示、综合告警和集中性能监视。
(3)采集管理域:主要采集被管对象包括基础设施和应用系统的相关性能、告警和配置信息上传给上层监控功能。
中国电信通过集团和省两级IT服务系统的建设,实现了包括:IT需求、事件和服务请求等运维流程的固化支撑;IT基础设施和MBOSS核心系统配置梳理及入库;IT基础设施全面监控及关键业务流程的端对端监控。同时,还提高了主动运维能力和运维效率,保障了服务质量。
2云资源池环境下对ITSM系统挑战
随着云计算的快速发展,中国电信加快了云计算的研究和应用。中国电信采用云计算技术整合内部IT系统的基础设施和应用架构,2011年集团和省建设了支撑MBOSS的PC服务器资源池,并将逐步完成可迁移应用,如CRM系统(客户关系管理系统)的Web、APP层向PC资源池的迁移,以提高基础设施共享水平及应用系统弹性,降低IT总体拥有成本。
资源池环境的变化运营和建设从流程上、资源使用方式上,给原来的IT服务管理系统带来了挑战,主要表现在以下方面:
(1)流程支撑:需要支持自助式资源申请、扩容、回收流程的固化和自动流转。
(2)CMDB管理:原有ITSM系统中的CMDB模型只考虑物理资源以及与应用和业务的关联关系管理,而引入虚拟化技术建设资源池以后,需要支持新的管理对象以及新对象之间的关联关系管理,如虚拟集群、宿主机、虚拟机、虚拟网络、虚拟交流机、虚拟数据存储等的管理对象以及它们之间关系管理;更为复杂的情况是由于系统自身的一些特点如CRM系统,目前的数据库应用仍很长一段时间内部署在原Unix服务器上,而应用服务器和Web服务器应用将部署到虚拟机环境上,这样从业务系统的视角中就能体现出物理资源和虚拟资源共存的关联关系管理。
(3)资源快速部署和按需动态伸缩能力:要求能通过虚拟机模板进行虚拟资源的快速部署和就绪,并可根据需要在应用繁忙时动态增加计算资源、空闲时释放计算资源,还能进行资源池内的计算资源动态迁移,高效稳定运行并充分利用计算资源。
(4)监控管理能力:在原来的物理资源监控的基础上要增加资源池虚拟资源的各种关键指标,如CPU性能(如CPU使用率、CPU冲突率、CPU冲突时间)、内存性能(如内存使用率、内存冲突率、内存需求数量)、存储性能(如磁盘使用率、磁盘I/O速率、命令时延)、网络性能(如网络I/O速率、丢包率)和告警信息进行监控,及时发现异常并采取主动预防措施。
(5)容量管理能力:从资源池整体的容量角度,监视当前资源池的容量及其使用量,形成统一集中视图,从而对资源池被管对象容量数据信息(资源区、集群、宿主机、虚拟机的容量情况等)进行统一管理,及时了解被管对象容量状况。在容量将被用尽前通过人性化展现方式及时通告运维人员,为容量规划提供主要的数据支持。
综合以上方面可以看出,在这种资源池运行环境下,流程支撑、监控管理、资源动态调度以及容量管理要求方面,原来ITSM系统的能力已经不能满足资源池环境下的运营,急需提升能力。
3云资源池环境下的IT服务管理系统能力设计
根据资源池的运营和管理要求,支持资源池管理的IT服务管理系统功能架构设计如图2所示。
(1)采集与控制域:在原来采集域的基础上增强采集能力,新增了对资源池的控制功能。通过屏蔽不同虚拟化厂商的资源池接口的差异性,并接应监视管理域和资源调度域的要求,对性能数据、告警数据、配置数据等进行采集和分析处理,再将数据进行存储和转发,负责建立、维护和断开资源调度域与被管对象的通道以及操作控制执行结果的反馈。
(2)监视管理域:增强的采集管理、性能管理、告警管理等功能主要是针对资源池的新的管理对象和管理关系的要求,采集新的性能指标、告警指标并设置动态的阀值,再判别性能能否满足要求,为健康管理和容量监视等分析优化工作提供必要的数据;拓扑管理需要从业务系统的角度能展示业务-应用-物理/虚拟资源的关联关系,并能基于这种关联关系实现告警关联和故障定位,监视管理域的拓扑管理功能不仅需要在各被管对象上展现配置数据,还需要展示关联的健康、容量和性能负载数据。
1)新增的健康度管理功能:主要是针对资源池的资源共享特性,对历史性能数据进行统计分析,采用自学习手段计算出资源池中的资源区、集群、宿主机、虚拟机在各时间点上的正常动态阀值区间,监控系统通过当前的性能数据与该时间点的阀值区间进行对比,判断发现潜在的健康性问题,要求动态区间由历史数据统计生成,因此不必再对各监控对象手工设定其阀值范围,既保证了监视的准确性又降低了人工成本;
2)新增的容量监视功能:主要根据资源池的资源容量及其使用量形成集中的视图,从而对资源池被管对象容量数据信息(资源区、集群、宿主机、虚拟机的容量情况等)进行统一管理,及时了解被管对象容量状况,在容量将被用尽前通过人性化展现方式及时通告运维人员,为容量规划提供主要的数据支持;
3)告警管理:通过对来自资源池的告警信息进行统一处理,以便快速确认故障,缩短排障时间,为及时恢复业务运行打下了良好的基础,资源池的告警来源主要包括性能阀值告警、容量预警及资源池被管对象的状态故障告警;
4)拓扑管理:根据资源池被管对象的基础信息及其内部关联关系生成不同的拓扑视图,并通过这些拓扑视图完成对被管对象的监测。监视管理域与服务管理域的拓扑管理功能的区别在于能形成业务系统视角的业务、应用与物理资源和软件资源的拓扑关系。
(3)资源部署与调度域:属于新增功能,是通过对包括虚拟资源和被虚拟化管理软件管理的物理资源(包括宿主机、存储以及网络)的管理,根据需求实现基于策略或模版的资源部署和调度,实现资源的生命周期管理。资源调度功能域包括资源发现及资源封装、资源部署调度和模板管理功能。
1)资源封装实现对物理资源、虚拟层的统一管理,屏蔽底层硬件及虚拟化异构,整合系统中所有可用资源,实现对资源的发现和资源信息的综合管理;
2)资源部署调度是对物理和虚拟资源的信息实现动态、弹性、按需的流程化及自动化调度,按照策略自动进行资源部署和操作,并可根据应用、服务的负载情况动态分配资源,对提供服务的资源提供可靠性保障策略,调度策略应至少支持高可用调度策略、负载平衡调度策略和电源节省调度策略等;
3)模板管理提供从创建、发布、激活、挂起、撤销到删除的模板生命周期管理,可为快速部署资源提供支撑。
4系统演进策略
原有的ITSM系统要实现对资源池的管理,需结合原有系统能力、实现难度、投资保护逐步对ITSM实现升级,分步实施可考虑以下演进策略:
(1)增强ITSM系统的监视管理功能,实现对资源池的监视管理,并利用原虚拟化厂商的管理软件实现对资源池的操作管理。
对原ITSM系统的服务管理域、监视管理域和采集与控制管理域进行改造,是将资源池的宿主机、虚拟机、虚拟网络等对象的性能、配置和告警信息纳入ITSM进行管理及初步的容量管理能力,同时对资源的申请、修改和回收流程在ITSM系统中进行固化;考虑到资源池操作的复杂性,同时考虑省公司在资源池建设初期都是以虚拟化厂商的产品为主,所以该阶段对资源池操作仍将依赖原虚拟化厂商管理软件如VMware的vCenter等。在这种环境下,资源池管理员需要在ITSM系统接收资源申请单,并根据对资源池操作结果,在ITSM系统进行人工回单。
(2)新增资源调度域功能,实现对异构资源池的统一部署和调度管理。
在ITSM系统实现资源池监视的基础上,新增资源调度域功能和操作控制功能,通过厂商提供的API实现对资源池操作控制,包括模版管理、策略管理和部署调度功能;本阶段应要求ITSM系统能屏蔽多厂家资源池接口的差异性,实现对多制式下资源池的统一管理和调度。
5结束语
资源池的运营对原来IT服务管理体系的流程和技术手段带来了新的挑战,应该适时调整IT服务管理流程,并适应资源池管理要求,逐步完善和补充ITSM系统的流程支撑能力、资源部署和动态调度、运行监控、容量管理和流程支撑能力,将资源池的运营管理纳入统一的IT服务管理体系中,提供更好的服务质量。
参考文献:
[1]陈春华,梁奂.全业务电信运营商的IT服务管理实践探讨[J].电信科学,2011(3):118-125.
[2]陈春华,李军,梁奂,等.资源池环境下的IT服务管理实施策略[J].电信科学,2012(9):142-147.
[3]JanvanBon.IT服务管理——基于ITIL的全球最佳实践[M].章斌,译.北京:清华大学出版社,2006.
[4]PeterBrooks.IT服务管理指标[M].丰祖军,译.北京:清华大学出版社,2008.