我们提供的运行维护服务包括,信息系统相关的主机设备、操作系统、数据库、中间件和存储设备的运行维护服务,保证用户现有的信息系统的正常运行,降低整体管理成本,提高网络信息系统的整体服务水平。同时根据日常维护的数据和记录,提供用户信息系统的整体建设规划和建议,更好的为用户的信息化发展提供有力的保障。
用户信息系统的组成主要可分为两类:硬件设备和软件系统。硬件设备包括网络设备、安全设备、主机设备、存储设备等;软件设备可分为操作系统软件、典型应用软件(如:数据库软件、中间件软件等)、业务应用软件等。
贵公司提供的信息系统服务的目标是,对用户现有的信息系统基础资源进行监控和管理,及时掌握网络信息系统资源现状和配置信息,反映信息系统资源的可用性情况和健康状况,创建一个可知可控的IT环境,从而保证用户信息系统的各类业务应用系统的可靠、高效、持续、安全运行。
服务项目范围覆盖的信息系统资源以下方面的关键状态及参数指标:
此项服务为基本服务,包含在运行维护服务中,帮助我们对用户现有的信息资产情况进行了解,更好的提供系统的运行维护服务。
服务内容包括:
我们提供的主机、存储系统的运维服务包括:主机、存储设备的日常监控,设备的运行状态监控,故障处理,操作系统维护,补丁升级等内容。
主机存储系统基本服务内容:
序号 |
服务模块 |
内容描述 |
提供方 |
---|---|---|---|
1 |
现场备件安装 |
配合用户进行。按备件到达现场时间工程师到达现场 |
设备厂商、 云云科技 |
2 |
补丁服务 |
消除软件漏洞给系统带来的安全隐患,并对安装补丁所引起的系统连锁反应进行合理的平衡。 |
云云科技 |
3 |
升级服务 |
对系统进行软件或硬件的升级,以改进、完善现有系统或消除现有系统的漏洞。 |
云云科技 |
4 |
现场故障诊断 |
按服务级别:7×24小时 5×8小时 |
云云科技 |
5 |
电话远程技术支持 |
7×24小时 |
云云科技 |
6 |
问题管理系统 |
对遇到的问题进行汇总和发布 |
云云科技 |
7 |
系统优化 |
对客户系统的括主机、存储设备、操作系统、提供优化服务。 |
云云科技 |
现场值守人员可进行监控管理的内容包括:
小型机系统巡检典型作业计划书(HP、AIX服务器部分) |
||||||
---|---|---|---|---|---|---|
系统管理单位:XXXX公司 |
||||||
设备名: |
设备型号
|
设备序列号
|
管理IP: |
|||
检查内容 |
参考标准 |
检查结果 |
状态是否正常 |
巡检方法描述 |
巡检周期 |
|
硬件运行状态 |
电源指示灯 |
|
|
▅正常 □异常 |
|
|
面板指示灯 |
|
|
▅正常 □异常 |
|
|
|
内置磁带机 |
|
|
▅正常 □异常 |
|
|
|
CPU 状态 |
|
|
▅正常 □异常 |
|
|
|
内存状态 |
|
|
▅正常 □异常 |
|
|
|
磁盘状态 |
|
|
▅正常 □异常 |
|
|
|
网卡状态 |
|
|
▅正常 □异常 |
|
|
|
HBA卡运行状态 |
|
|
▅正常 □异常 |
|
|
|
系统检查 |
系统日志 |
|
|
▅正常 □异常 |
|
|
|
|
|
▅正常 □异常 |
|
|
|
文件系统,包括磁盘卷剩余空间 |
|
|
▅正常 □异常 |
|
|
|
硬件检测 |
|
|
▅正常 □异常 |
|
|
|
交换分区 |
|
|
▅正常 □异常 |
|
|
|
固件版本 |
|
|
▅正常 □异常 |
|
|
|
补丁包版本 |
|
|
▅正常 □异常 |
|
|
|
系统镜像 |
|
|
▅正常 □异常 |
|
|
|
存储磁盘 |
|
|
▅正常 □异常 |
|
|
|
存储驱动 |
|
|
▅正常 □异常 |
|
|
|
进程状态 |
|
|
▅正常 □异常 |
|
|
|
系统性能检查 |
CPU利用率 |
|
|
▅正常 □异常 |
|
|
内存利用率 |
|
|
▅正常 □异常 |
|
|
|
磁盘I/O性能 |
|
|
▅正常 □异常 |
|
|
|
数据库运行状态 |
数据库安装目录 |
|
|
▅正常 □异常 |
|
|
数据库进程状态 |
|
|
▅正常 □异常 |
|
|
|
集群检查 |
集群进程状态 |
|
|
▅正常 □异常 |
|
|
集群日志 |
|
|
▅正常 □异常 |
|
|
|
存储检查 |
存储设备故障灯状态 |
|
|
▅正常 □异常 |
|
|
SAN交换机端口状态 |
|
|
▅正常 □异常 |
|
|
|
存储交换机环境状态 |
|
|
▅正常 □异常 |
|
|
|
系统故障报告 |
|
|
▅正常 □异常 |
|
|
我们已经针对本项目制定了详尽的设计、应急处理预案,整个流程严谨而有序。但是,在服务维护过程中,意外情况将难以完全避免。下面,我们将对项目实施的突发风险进行详细分析,并且针对各类突发事件,设计了相应的预防与解决措施,同时提供了完整的应急处理流程。
维护服务应急处理流程
针对上门服务过程中可能遇到的各种各样的风险,我们总结自身维护服务经验,针对一些可能出现的情况,制定了一系列预防处理措施,举例如下:
类型 |
事件 |
预防措施 |
处理 |
---|---|---|---|
应用软件 |
无法启动软件可执行文件 |
上门人员提前准备好各类需维护软件安装程序 |
将应用软件数据文件备份后,重新安装 |
软件打开过程中或运行中异常错误关闭 |
上门人员准备好安装程序,操作系统优化和修补软件,查杀病毒软件 |
判断出错原因,备份数据,采取相关修复措施 |
|
操作系统 |
使用者本机操作系统异常或系统资源占用严重 |
准备好系统检查程序及修补程序,以及查杀病毒软件 |
告知使用者错误原因可能类型,提出解决方案,经使用者认可后采取相应措施 |
B/S结构系统,IE浏览器异常或无法下载控件 |
准备流氓软件清理程序、修复浏览器软件、查杀病毒软件 |
检查IE浏览器选项设置,分析原因进行修复 |
|
网络或服务器 |
B/S结构系统网络流量异常或服务器登录异常 |
判断服务器是否异常,否则准备杀毒软件 |
检查网络流量,流量异常小则报修网络服务商,流量异常大则查杀病毒 |
系统运维应急方案是对中断或严重影响业务的故障,如宕机、数据丢失、业务中断等,进行快速响应和处理,在最短时间内恢复业务系统,将损失降到最低。在系统维护过程中,突发事件的出现将是很难完全避免的,针对这种情况,我们设计了完善的突发事件应急策略。
系统巡检人员要定期规范检查各硬件设备的运转情况和应用软件运行情况,同时做好日常的数据增量备份和定期全备份。对发现的问题在报各级负责人的同时,要协调相关资源分析问题根源,确定解决方案和临时解决措施,避免造成更大的影响。问题得到稳定或彻底解决后,要形成问题汇报,避免以后类似重大紧急情况的发生。
对发现的问题在报负责人的同时,要协调相关资源分析问题根源,确定解决方案和临时解决措施,避免造成更大的影响。问题得到稳定或彻底解决后,要形成问题汇报,避免以后类似重大紧急情况的发生。
我们不但拥有经验丰富的技术支持工程师,而且根据长期以来的客户服务工作经验,建立了常用知识库,其中包括多种常见技术故障和突发事件的应急策略。当获悉出现突发事件时,技术支持人员可以立即从知识库中获取相应的应急策略,并综合用户方的具体情况,给出相关解决方案,然后在第一时间以电话、邮件支持或现场服务的方式帮助用户解决问题,尽最大努力减小突发事件对用户日常应用的影响。
紧急情况 |
预防措施 |
应急策略 |
硬件损坏 |
项目单位操作用电脑硬件损坏 |
在磁盘数据未丢失情况下,保证数据安全性,建议项目单位替换相关硬件。 |
操作失误 |
加强培训力度,掌握培训效果,检验操作人员操作水准,提示注意事项。 |
操作失误未造成即成结果或数据未丢失情况下,保障数据安全,反之,协调相关部门,进行补救。对操作人员强调注意事项 |
配置丢失 |
培训时强调使用前配置方法和步骤,并特别提示需在使用前按要求操作 |
派出上门维护、培训人员重新配置,并耐心讲解。 |
数据丢失 |
培训时强调使用过程中注意定期备份重要数据,日常维护过程中,上门服务人员实时备份数据并告知用户 |
协调有关部门,进行补救,无法补救,提交报告说明原因。 |