盛元彩票|

以客户为关注焦点,提供优质IT服务,持续为客户创造IT价值

当前位置:首页 > 产品服务 > 集成服务 >

运维平台建设服务

天翼科贸科技o2016-06-29 15:11:56o集成服务o

IT运维服 务体系建设思路

数据中心IT运维服务体系建设,应包含运维服务制度、流程、组织、队伍、技术和 对象等方面的内容。同时结 合人民银行的业务特色,整合运维服务资源,规范运维行为,确保服务质效,形成统一管理、集约高 效的一体化运维体系,从而保 障人民银行数据集中条件下网络和应用系统安全、稳定、高效、持续运行。

一、运维服 务体系建设原则

运维服 务体系建设的原则有以下几个方面。

一是以 完善的运维服务制度、流程为基础。为保障 运行维护工作的质量和效率,应制定相对完善、切实可 行的运行维护管理制度和规范,确定各 项运维活动的标准流程和相关岗位设置等,使运维 人员在制度和流程的规范和约束下协同操作。

二是以先进、成熟的 运维管理平台为手段。通过建立统一、集成、开放并 可扩展的运维管理平台,实现对 各类运维事件的全面采集、及时处理与合理分析,实现运 行维护工作的智能化和高效率。

三是以 高素质的运维服务队伍为保障。运维服 务的顺利实施离不开高素质的运维服务人员,因此必 须不断提高运维服务队伍的专业化水平,才能有 效利用技术手段和工具,做好各项运维工作。

QQ图片20151030112302.pngQQ图片20151124143922副本.png

二、运维服 务体系的总体架构

运维服 务体系由运维服务制度、运维服务流程、运维服务组织、运维服务队伍、运维技 术服务平台以及运行维护对象六部分组成,涉及制度、人、技术、对象四类因素,其总体架构如图1所示。制度是 规范运维管理工作的基本保障,也是流程建立的基础。运维服 务组织中的相关人员遵照制度要求和标准化的流程,采用先 进的运维管理平台对各类运维对象进行规范化的运行管理和技术操作。

1.运维服务制度和流程

为确保 运维服务工作正常、有序、高效、协调地进行,需要根 据管理内容和要求制定一系列管理制度,覆盖各类运维对象,包括从投产管理、日常运 维管理到下线管理以及应急处理的各个方面。此外,为实现 运维服务工作流程的规范化和标准化,还需要制定流程规范,确定各 流程中的岗位设置、职责分 工以及流程执行过程中的相关约束。

2.运维服务组织和队伍

人民银 行科技部门根据其运维服务工作的内容和流程确定各项工作中的岗位设置和职责分工,并按照 相应岗位的要求配备所需不同专业、不同层次的人员,组成专 业分工下高效协作的运维队伍。分行科 技处负责数据省级集中处理的应用系统和本机构开发的应用系统部署和运行维护,承担辖 内网络的运行管理。辖内各 中支和支行科技人员承担本行系统运行维护和故障处理。

3.运维服务工作流程

为保障 运行维护体系的高效、协调运行,应依据管理环节、管理内容、管理要 求制定统一的运行维护工作流程,实现运 行维护工作的标准化、规范化。其环节包括事件管理、问题管理、变更管理和配置管理。

4.运维技术服务平台

运维技 术服务平台包含实施运行维护和技术服务的各种手段和工具,通过技 术手段固化标准化的流程、积累和 管理运维知识并开展主动性运维工作。

三、运维的范围

1.全国集 中的核心应用系统

全国集 中的核心应用系统的运维由总行负责,分行中 心负责业务咨询工作和向总行反馈使用情况等。

2.分行部 署的核心应用系统

分行部 署的核心应用系统的运维由分行中心负责,分行中 心负责技术性维护,业务维 护由分行业务部门负责。

3.分行自建系统

分行自 建系统可以分为以下三类:

(1)全辖使用,这类系 统的运维由分行中心负责,分行中 心负责技术性维护,业务维 护由各分行业务部门自行负责;

(2)省内使用,这类系 统的运维由分行中心负责,分行中 心负责技术性维护,业务维 护由分行业务部门自行负责;

(3)分行机关使用,这类系 统的运维由分行中心全面负责。

 

四、运维服 务体系建设的内容

1.运维管理制度建设

总结现 有的运维管理经验,遵照国 内外相关运维标准,结合目前的实际情况,统一制 定运维管理制度和规范。通过定 期和不定期的检查,促进各 项制度规范在分行数据中心的贯彻落实,从而建立起全辖统一、规范的 运行维护管理工作方式。同时,随着人 民银行信息化建设的不断发展,也要确 保各项制度的及时更新。制度体 系内容要涵盖机房管理、网络管理、资产管理、主机和应用管理、存储和备份管理、技术服务管理、安全管理、文档管 理以及人员管理等类别。各类制 度具体内容因需要而定,如网络 管理制度需覆盖网络的接入管理、用户管理、配置管 理及网络日常运行管理和应急处理等。安全管 理制度需覆盖包括机房设施、网络、主机、数据库、中间件、应用软件、数据信息的安全管理、其他机 密资源和人员的安全管理以及安全事件的应急处理等。

2.运维技术服务平台

运维技 术服务平台由运维事件响应中心、运维管理系统、运维知 识库和运维辅助分析系统构成(如图2所示)。平台采用分行级、中支级 分布式管理模式,在分行 科技处和各中支分别部署。

(1)整合分行IT监控平台

将分行 级数据中心的监控数据交换到运维事件响应中心、运维流程管理系统、运维知识库、运维辅助分析系统,支撑运维体系。

分行级 中心向总行中心传送的信息包括:网络管理、主机管理、数据库管理、存储备份管理、中间件管理、应用系 统管理的相关信息,报表系 统产生的设备资产、运行性 能和运行事件报表,事件告 警机制产生的关联和上报信息;省级中 心和地市中心支行之间传送的管理信息为网络管理信息。

(2)运维事件响应中心

负责客 户端运行和应用系统问题的接收及转发的部门是各级科技部门。问题接 收分为网络响应和电话响应两种方式,对于响 应人员无法当场解决的问题,转发到 运维部门的相应岗位,并向用 户反馈解决情况。对于分 行级数据中心运维难以解决的问题,上报总 行并配合总行进行问题的解决。同时,实现问题库的维护、解决情况的反馈、解决方 案的查询等功能。

(3)运维服务管理系统

运维流 程管理系统的建立,可以使 日常的运维工作有序化,职责角色清晰化,能够有 效地提高解决问题的速度和质量,使运维 部门内的相关支持信息更为畅通、透明、完整,实现知 识的积累和管理,更好地 进行量化管理和设定优化指标,进行持续地服务改进,最终提 高整个运维工作的效率和质量。

(4)运维知识库建设

知识库 建设是人民银行信息系统运维体系的重要组成部分,基于统 一的技术支持平台,通过整合总行、分行数据中心、合作单 位和协作厂商的技术资源和解决方案,实现对 全行有效的技术支持工作。

 运行维 护知识库由知识库平台和知识库内容两部分组成。知识库 平台包括知识检索、知识维护与管理等,可以通过纯Web方式向 服务请求对象提供基于Web的查询 服务和检索服务,以完全 共享知识库中的知识,在提供Web服务时,还可通 过响应中心平台来即时地响应用户请求的服务。

(5)运维辅助分析系统

以日常监控平台、运维响应中心、运维流 程管理系统为基础,通过统计分析,了解运 维服务能力与服务质量的现状,并可以进行趋势分析,为运维 管理决策提供支持。

3.运行维护管理流程

为加强 对信息系统的运行维护管理,确保运 行维护体系高效、协调运行,应依据运维管理环节、管理内容、管理要 求制定统一的运行维护工作流程,实现运 行维护工作的标准化、规范化和自动化。通过建 立运维管理流程,可以使 日常的运维工作流程化,职责角色更加清晰,从而使 解决问题的速度和质量得到有效提高,实现知 识积累和知识管理,并可以 帮助运维部门进行持续的服务改进,提高服 务对象的满意度。运行维 护流程包含的环节有事件管理、问题管理、变更管理及配置管理。

(1)事件管理

所谓事件,是指发生的对IT体系某 一环节运行造成影响的事件,包括系统崩溃、软件故障、任何影 响用户业务操作和系统正常运作的故障、以及影 响业务流程的情况,事件也 包括一个用户的请求。

对日常 性运维工作中出现的突发事件(即日常 运行维护管理平台自动发现并产生的告警事件)和由用户/维护人 员报告的事件会转入事件管理流程,事件管理流程如图3所示。

(2)问题管理

问题是 指导致事件产生的原因,许多事 件往往是由同一个问题引起的。问题的 来源主要有以下几种:①已经处理的事件,经过回顾分析后,可能形成一个问题;②重大事件,虽然经 过紧急处理恢复服务,但未找到根本原因,也形成一个问题;③对于趋 势性事件的分析,并形成问题。

问题管 理流程可以按照不同领域的问题(如网络、主机、中间件、数据库、应用等)由相关 领域的技术支持专家来处理。原则上 这些专家可以是二线支持专家,他们在 负责接受来自一线支持人员的支持请求的同时,也负责 对以往事件进行分析,找出事 件产生的根本原因,从而确定解决方案,消除这些根本原因,最终使 此类事件不再发生;另一方面,也要从 发生的事件中找出事件的发展趋势或潜在可能发生的问题,主动提供预防性措施,提高系统可靠性,降低运维成本。

问题管 理流程着重于消除事件或减少事件发生,确定事件的根本原因,其流程如下:首先,定期分析事件,找出潜在问题,调查问 题以找出其原因,制定解决方案、变通方 法或提出预防性措施,以消除产生原因,或在重 发时使其影响力最小化。其次,记录解决方案、变通方法、预防性措施,根据需 要添加到知识库中。再次,提出变更请求,对问题 的解决方案进行评估,通过提 出变更请求以对该方案进行测试和实施。最后,问题必 须进行事后回顾以找出改进机会或总结预防性措施,包括改进事件监测、找出技 能差距和文档资料改进等。

(3)变更管理

变更请 求通常由于问题的解决方案中需要对生产环境进行某些改变而产生,变更请 求来源于问题管理环节或由用户提交。变更管 理通过一个单一的职能流程来控制和管理整个信息系统运行环境中的一切变更,范围可包括软件,硬件,网络设 备和文档等的变更,其流程如下。

①由用户 或问题管理环节的维护人员提出变更申请,由运维 负责人检查和完善其内容,并进行风险等级、优先级的初步评估。

②通过分类,确定是否为重大变更、紧急变更,如果是常规变更请求,则由运 维负责人安排实施;如果是风险等级为“重大”的变更请求,则应上 报变更管理小组。

③根据特 定的变更请求成立特定的变更管理小组,成员包 括对该变更申请有批准权的人员、对该变 更的评估和批准提供参考意见的技术人员和管理人员。评估内 容包括变更的技术可行性、对系统性能的影响、对现有服务的影响、对资源的需求等。

④变更管 理小组评估后决定是否批准变更申请。变更请求得到批准后,运维负 责人安排相应资源进行变更的计划、测试,并制定实施方案,确定实施时间表,分配相应资源,通知请求人。

⑤相应岗位实施变更,运维负 责人监视实施过程,并在必要时进行协调。

⑥定期回 顾变更管理流程以提高效率和效能,在实施 变更流程不久之后,可以进行第一次回顾,以确保 流程得到正确实施并达到预期目的。对发现 的问题必须追根溯源并尽快解决,之后可 以定期举行回顾。

(4)配置管理

配置管 理是服务管理的一个核心流程,能确保 应用系统及其运行环境中所有IT设备/系统及 其配置信息得到有效完整的记录和维护,包括各IT设备/系统之 间的物理和逻辑关系,从而为 实现有效服务管理奠定基础。

配置管 理流程着重于管理生产环境中所有必须控制的组成元素,并为其他相关流程(如事件管理等)提供信息,使这些 流程更有效地运行,从而确 保应用系统环境的完整性和稳定性,其主要流程内容如下。

①识别和维护配置元素:确定需 要进行配置管理的元素及所有必需的配置属性,并指明 与生产环境中其他配置元素之间的关系。对配置 管理数据库提供日常维护。

②配置状态汇总:根据需 要定期产生配置管理报表,并能使 相关人员进行相关配置的提取、查询,定期产 生配置项的状态报告,并能反 映配置项的版本和变动历史。

③审计和确认:定期审 核全部或部分配置数据库中的配置项,确认其 和物理环境的一致性,从而确 保配置信息的完整性。

④计划、回顾和改进:定期制定计划(如半年),以明确 下阶段配置管理工作;定期回 顾流程和审核结果,找出需 要改进的配置项。

⑤配置管理数据库(CMDB):配置管 理数据库由配置识别活动来定义,配置识 别活动不但要定义配置项,还需定 义配置结构及配置项的相互关系。

4.运维项目管理流程

项目管 理模块主要管理IT项目整 个生命周期从立项准备、立项、采购、实施、验收、收尾各 个阶段的任务和参与人。从功能 上理解项目管理类似于发布管理流程,即总行 部署的应用系统分行仅需要展开实施和验收工作即可,而分行 自建项目是一个完整的项目管理流程。

(1)系统开发。开发管 理流程需要进一步完善和标准化,特别是文档管理、测试和 版本管理方面需加强。同时,加强开发计划管理,在《开发项目管理规范》中明确要求:根据立 项内容进行系统、全面的需求调研,提出短 期和长期的开发计划,并编写需求分析报告。根据需 求分析报告对系统进行可行性分析,包括经济可行性分析、技术可 行性分析和操作可行性分析三个方面,并在此 基础上编写可行性报告。根据需 求分析报告进行系统设计,同时根 据系统设计进行系统实施。

(2)系统测试。首先,应制定 出详细的测试计划和方案及测试数据和测试案例,并形成测试大纲。其次,根据测 试大纲对系统反复进行测试并做详细的测试记录。为确保 系统的正确无误,应对系 统进行实地试运行,试运行 应选择多个环境且需求比较复杂的机构进行,应比照 设计方案对新应用软件系统的功能和性能进行彻底测试和考核,并形成 量化的运行报告。

(3)外部资源管理。外部资 源的合理利用是推动分行信息技术的发展重要因素,分行的 外部资源主要包括设备供应商、软件供应商等。

5.运维知识库系统

运维知识经验的总结、维护和 共享是提高员工运维技能水平、增强单 位凝聚力的重要手段,也是把 宝贵的经验教训从支持人员头脑逐步沉淀、固化的重要方式。知识维 护既要鼓励员工积极提交知识,防止知识库变成“空库”;同时又 要及时进行审核和维护,防止知识库变为“垃圾库”。

(1)知识来 源主要有以下几个方面:一是各 级运维支持人员日常工作中积累的经验;二是知识管理员总结、导入的经验。知识管理员研究、获取外 部的知识和经验后,定期或 随时整理这些知识,导入到知识库中,供所有用户共享。知识的获取、维护是 信息网络管理员的重要职责之一。

(2)知识提交审核。各个系 统管理员提交知识到知识库之后,需要经 过知识管理员的审查、修正,才变为正式发布状态,以减少 知识中的谬误和差错。知识管理员定期(每季度一次)检查所有的正式知识,逐条进行核实、修正和优化。修正和 维护操作与审核新提交知识草案过程相同。

(3)知识检索和使用。在知识 变为正式的发布状态之后,可以供 各类用户随时检索引用。用户可 以研究学习这些知识,也可以 在解决问题的过程中有目的地检索。知识记 录维护用户阅读次数和用户引用解决问题次数的计数器,引用和阅读次数越多,该知识的价值越大。

6.运行维护队伍建设

(1)队伍组建。针对目前信息系统IT资源现 状以及对技术支持的需求,组成各 类别维护人员的专家队伍,集中的 开展运行维护工作。

(2)人员管理。对各级 运行维护人员尤其是高级运行维护人员的管理,应制定 一套切实可行的管理办法,包括人员配置、职责划分、人才库建立、人员培训、人员考核、人员待遇等。通过科 学的管理办法和有效的激励机制,充分调 动各级运行维护人员的工作积极性和责任心,为做好 信息系统运行维护工作打好基础。

7.运行维护制度建立

为确保 运行维护工作正常、有序、高效地进行,必须针 对运行维护的管理流程和内容,制定相 应的运行维护管理制度,实现各 项工作的规范化管理。运行维 护管理制度可分为以下几个方面。

(1)网络管理制度:包括网 络的准入管理制度、网络的配置管理制度、网络的运行/监控管理制度等。

(2)系统和应用管理制度:包括对主机、数据库、中间件、应用系 统的配置管理制度、运行/监控管理制度、数据管理制度等。

(3)安全管理制度:包括网络、主机、数据库、中间件、应用软件、数据的 安全管理制度及安全事故应急处理制度。

(4)存储备份管理制度:包括备 份数据的管理制度和备份设备的管理制度。

(5)故障管理制度:包括对 故障处理过程的管理制度、故障处 理流程的变更管理制度、故障信 息利用的管理制度及重大故障的应急管理制度等。

(6)技术支 持工具管理制度:包括对 日常运行维护平台、响应中心、运维流程管理平台、运行维护知识库、运维辅 助分析系统等的使用、维护的有关制度。

(7)人员管理制度:包括对 运行维护人员的能级管理制度、奖惩制度、考核制度、人民银 行系统外部人力资源使用的管理制度等。

(8)质量考核制度:制定相关制度,对以上 各类制度的执行情况进行考核。

随着整 个信息化应用内容的不断发展,一些旧 的运行管理制度势必不能适应新发展的要求,必须进行不断的改进,并制定 相适应的新的管理制度,逐步完善管理机制。

文章关键词
友情链接:    鍏冨疂妫嬬墝-棣栭〉   浜戦紟妫嬬墝浠g悊   姘歌儨妫嬬墝鎵嬫満瀹樼綉鈻撴案鑳滄    鐪熶汉妫嬬墝鍦ㄧ嚎娓告垙骞冲彴-瀹樼綉骞冲彴鎵嬫満app