三、IT运维管理
IT运维使用IT运维管理系统,方便运维工作的管理。
(一)、系统简介
系统采用了纯B/S架构,纯J2EE技术架构。
(二)、系统功能
1、网络拓扑管理
系统可进行拓扑管理和IP地址管理:系统能自动发现、管理所有支持SNMP协议的网络节点,自动生成整个网络的物理拓扑结构图,包括设备间的冗余连接、备份连接、均衡负载连接,支持拓扑添加算法,支持滤除无须管理的SNMP网络节点,生成的拓扑图可打印导出。
实时监测的性能参数如网络设备性能参数包括CPU负载、内存利用率、连续运行时间等。
系统能提供完整的IP—MAC对照表,提供完整的MAC—设备端口对照表。支持IP—MAC绑定监视,MAC与设备端口的绑定。能够进行IP设备的网络拓扑定位。
2、网络设备管理
支持简单网络管理协议SNMP v1、v2c和v3方式轮询监控的方式,可对设备的基本信息、设备可用性、设备性能、设备端口性能等进行监控管理。可浏览设备的所有接口并以图表形式展现;可对设备进行实时分析,提供设备监控诊断信息;提供方便的设备ARP表、路由表信息展现,提供PING、Traceroute工具等管理工具方便管理员的使用。
3、主机系统管理
支持对Microsoft Windows、Linux、UNIX操作系统的监控,支持Agent/SSH/SNMP/WMI等方式监控操作系统。系统可对服务器的硬件和配置信息进行管理,管理的内容包括:cpu、内存、服务器运行状态、服务器磁盘状态、网卡状态、进程总数、磁盘空间大小、ip数量、系统名称、内存利用率、虚拟内存(交换区)的使用率、交换SWAP分区页数量(换入/换出)、磁盘空间利用率、磁盘读/写速率、磁盘TPS指标、各文件系统分区的使用率和空闲空间、指定的关键文件是否存在和当前大小;包括进程ID、进程名、进程状态、占用CPU时间、内存占用大小等、检查服务器的关键日志文件、Windows服务等参数进行监控。
支持主机的配置变更管理, 记录配置变更的资源,支持对配置变更历史查询。
动态展现当前服务器的CPU负载、内存利用率、连续运行时间、进程数、线程数、句柄数、硬盘读写速率、虚拟内存使用率、网卡使用率、内存页交互速率、当前在线用户数等指标状态或速率的运转图。
4、应用管理
数据库管理:支持对主流的数据库进行监测,例如Oracle、MS SQL、MySQL、Sybase、DB2等。
中间件管理:支持对weblogic、websphere、Domino、Tuxedo等监控。
应用服务管理:HTTP/HTTPS服务监测、FTP服务监测、监测SMTP服务工作状态、监测POP3服务工作状态。
DNS服务监测:DNS服务端口是否打开,DNS服务是否正常。
LDAP服务监测:监测LDAP服务是否工作正常。
DHCP服务监测:DHCP服务端口是否打开,服务是否正常。
数据关联:同一IP地址的主机系统、数据库、中间件、应用服务的详细信息总揽能进行逻辑关联,相互快速切换。
5、日志监控
监控日志类型 支持对通用日志和Syslog日志的监控,支持关键字告警。
6、业务模拟仿真监控
仿真监控:系统支持对B/S架构的业务系统进行多页面的自动模拟仿真监控。监控每一网页的使用时间。并支持延时告警。
7、业务服务管理
业务结构管理要求:系统能够清晰的绘制出各业务系统的结构架构图,其中包含业务架构图和业务架构列表,要求系统能够反映各业务系统从网络层到服务层到应用层各方面的组成情况,系统可以对每个业务节点定义动态参数指标,一旦系统出现告警,系统可以在相关的业务单元上显示告警。
业务运行管理要求:业务系统运行管理系统要求对各业务系统的连续运行时间,业务中断时间,业务响应时间和业务故障原因等关键业务运行指标。
8、机房巡检
巡检模板:系统提供自定义的机房巡检模版。给运维人员进行日常机房巡检使用。
9、告警管理
告警设置:可以根据不同的阀值设置告警。
告警方式:系统支持通过多种方式将警报及时发送相关人员,能支持以下方式的告警输出:短消息网关、语音电话、E-MAIL通知、桌面消息框告警、拓扑图标指示走马灯告警等,并可以灵活调用第三方程序,与之联动。能够灵活的设计告警的策略和告警的时间计划。
告警策略:提供多次告警归并的告警风暴抑制策略和告警升级策略。
告警升级策略的条件可由用户自定义。
10、报表系统
提供多种报表展现:提供工作报告、资源对比报表、可用性报表、故障报表、事件报表、趋势分析报表、统计报表、TOPN、流量分析等功能报表。
定时报表:定时提供报告/报表。系统会自动生成相应的报告,发送给系统管理员。
报表导出:支持将任何查询报表导出为PDF、EXCEL格式。
报表打印:支持将任何查询报表直接打印。
11、总体展现
首页展现:支持常规菜单页面,支持自定义画面内容组合首页。
12、安全管理
权限控制:系统提供用户访问权限的划分,能够设置用户管理网络的设备的数量及操作权限,可以根据设备的重要程度将被管设备分为不同的组,通过设置权限,每个管理员只能看见他所关心的设备。
数据安全:被监控端和网管系统之间的监控数据均支持加密方式传输。
网管操作审计:满足审计要求,支持审计功能,可多种方式查阅用户在系统中的操作时间和操作内容等。
自我保护机制:系统具有自我保护机制,出现问题自动收集日志并将邮件发给相关人员。