为什么需要网管?
网管系统屏蔽不同厂家、不同机器在监控、维护、及管理上的差异,提供统一的工具,从而“集中监控、集中维护、集中管理”提供可靠、便利的手段,为了快速实现业务提供有效支撑。一般网管系统实现以下功能:系统管理(分组/网元管理)、配置管理、故障管理、性能管理、维护管理(工单、计费管理)、安全管理(AAA)。
什么是网管?
1 系统管理(分组/网元管理)
1.1 拓扑管理(有可能与GIS结合) 拓扑管理为被监控的网元提供统一的网络拓扑与多视图管理,使管理员能够在视图上直观的掌握整个网络的拓扑结构及网络设备运行状态。
网元网络拓朴管理主要包括 网络拓扑状态监视功能以及拓扑视图管理功能。
拓扑状态监视包括网元网络中拓朴结构和设备状态更新、设备告警监视、拓朴中节点与链路管理等功能。拓扑视图管理包括拓朴视图层次显示,视图的缩放功能,支持多种布局以及视图基本属性编辑功能。
1.2 资源清单管理
资源管理:创建资源,修改资源,查询资源,删除资源
资源清单管理功能实现对设备信息、版本/配置文件信息的获取、查询和统计功能,同时能够根据业务需要(地区、机构、行政等)进行灵活的组织
管理对象包括:网元、机框、槽位、单板、应用组件。
1.3 用户管理:用户、角色、权限、资源等管理
2 性能管理
性能管理功能主要负责对网元系统设备的性能监视和分析。通过从设备侧采集各种性能数据,经处理后产生性能报告,为维护部门和管理部门提供信息,指导网元业务部署、规划和调整,提高网元业务的服务质量。 各种采集器、传感器等采集任务的周期和业务相关的采集量(连接数、流量、用户数等)可定制,采集的原始数据和分析数据可保存至数据库或外部文件。
性能数据可通过图表或者图形化界面显示。
性能管理的对象包括: 网络性能管理:针对整个网络的性能管理
网元性能管理:针对各个网元实体性能管理
终端性能管理
组件性能管理
性能管理功能包括:
实时性能监控;以列表或图表方式监控指定的对象的相应指标的变化趋势,可定制采集粒度
性能数据采集任务的定制
采集任务定制的功能主要包括
查看任务列表、任务详细信息
增加、挂起、激活、删除任务
采集任务主要包含以下信息
采集对象列表:可以是网元,单板等
采集性能参数列表
采集任务起止时间
采集时间间隔
采集任务状态
性能数据采集;
性能报表管理
性能门限管理;性能门限设置
网络视频监控平台应能支持网管所采取的网络性能管理行动,并测试统计汇报其结果。具体包括:
自动获取网络拓扑结构及网络的配置,实时监控设备的状态;
通过对被管理设备的监控和轮询,获取有关网络运行的信息及统计数据;并能在所收集的数据的基础上,提供网络的性能统计,
例如:
网络节点设备的可利用率; 网络节点设备的处理器利用率;
网络节点设备的故障率;
网络延时统计等;
带宽统计利用率;
对历史统计数据的分析功能。
3 配置管理
配置管理功能实现对设备运行参数、网元业务的相关属性进行配置,支持远程在线的参数配置、软件升级等操作。管理员可以查询设备的配置参数和业务参数,并通过日志管理功能查询以往的设备配置操作记录。
网络视频监控平台应能支持网管系统对其进行的更新、升级等配置管理,完成软件/硬件的重新配置。
配置管理数据库:创建并维护一个数据库,其中包含网络设备、软件、操作级别、负责维护设备的人员等信息;
管理设备的配置文件: 可以访问被管理设备的配置文件,并在必要时分析和编辑;
网络节点设备部件、端口配置;
网络节点设备系统软件的配置;
对配置操作过程的记录统计;
CPU、内存、IO、网络流量等阀值配置管理。
4 故障管理
故障管理功能主要负责实时接收网元设备上报的各种告警和事件,能够实时地以可闻、可视的形式提示维护人员,维护人员可进行确认。告警数据入库保存,并提供告警统计和查询以及告警前转功能。网络视频监控平台的主处理机、存储器发生严重故障或严重过负荷时,应能向操作维护中心或网管中心发出告警信息,当告警消除时,亦应有报告。
网络视频监控平台应能配合操作维护中心或网管中心对故障进行测试诊断与定位,按指令完成软件/硬件的重新配置,并具有故障恢复功能。具体要求如下:
故障发生时实时告警并显示;
定位并跟踪、辨认错误;
执行诊断测试;
手动或者自动纠正错误、排除故障等;
针对错误检测报告作出反应;
生成错误日志,对日志进行维护并形成故障统计。
实时地自动接收全网所有网元上报的故障告警和事件报告。
自动检测全网内所有网元的链路状态
5 运维管理(告警信息处理)
告警信息主要包括当前告警和历史告警,当前告警是指网络中还未清除的告警,历史告警是指网络中已经清除的告警。当一个当前告警被清除后,该告警记录自动转换为历史告警。
电子工单系统、运维系统、派单系统
• 查看当前告警列表、告警属性、告警知识库
• 定位告警网元
• 根据网元和告警级别、告警时间自动确认告警
• 手工确认告警、取消确认告警、清除告警
• 增加、修改、删除当前告警视图
• 抑制、过滤当前告警
• 设置告警通知
• 重新定义告警级别
历史告警处理功能:
• 查看历史告警列表、告警属性、告警统计信息
• 手工确认历史告警
• 查看、修改历史告警属性
6 安全管理(AAA)
安全管理应包括数据安全和系统安全,具有如下功能: 系统安全
网管系统采取高级别、多层次的安全防护措施;
网管系统应提供严格的操作控制和存取控制 权限模型;
自动记录非法信息,并将系统的状态自动记录,以便系统出现安全问题时能够容易地找到原因。
数据安全
对各种配置数据、统计数据采取备份、保护措施;
采用多级别的方法,备份用户数据。
人工或手工修复
当网络系统出现故障时,能自动及人工恢复正常工作,不影响网络的正常运行等。
当前网管的规范有哪些?
系统管理(网元管理)、配置管理、故障管理、性能管理、运维管理(AAA/计费管理)和安全管理5个系统管理功能域。
ISO/IEC 7498-4:1989 Information processing systems -- Open Systems Interconnection
-- Basic Reference Model -- Part 4: Management framework
ISO/IEC 7498-1:1994 Information technology -- Open Systems Interconnection
-- Basic Reference Model: The Basic Model
ISO 7498-2:1989 Information processing systems -- Open Systems Interconnection
-- Basic Reference Model -- Part 2: Security Architecture
ISO/IEC 7498-3:1997 Information technology -- Open Systems Interconnection
-- Basic Reference Model: Naming and addressing
网管协议:SNMP(Simple Net Management Protocol)、CMIP(Common Management Information Protocol)
OSI很早就在OSI的总体标准中提出了网络管理标准的框架,即ISO 7498-4。ITU-T在网络管理方面紧密地和ISO合作,制订了与ISO 7498-4相对应的X.700系列建议书。
ISO 和ITU-T制订的两个重要标准是:
(1)ISO 9595 ITU-T X.710 公共管理信息服务定义CMIS
(2)ISO 9596 ITU-T X.711 公共管理信息协议规格说明CMIP
《电信运营支撑系统(第二版)》