网信办承担着网络安全保障、网络舆情监测、信息资源管理及信息化建设统筹等职责,已建成覆盖政务外网、政务专网、社区村网络及财政网络的综合信息化体系。
在国家网络强国战略和数字政府建设持续推进背景下,网信部门信息化建设规模不断扩大,对网络安全保障和运维管理能力提出了更高要求。
本期案例优选,向您介绍某网信办智能运维建设项目。北塔智能运维平台通过构建智能化的运维管理体系,为网络安全建设和服务保障提供有力支撑。
一、用户背景
某网信办
内设 3 个职能科室,大数据管理中心、网络安全应急指挥中心、网络安全和信息化委员会办公室
主要负责网络内容与舆情管理、网络安全保障、信息化建设推进
共建成2个机房,目前为止,网络设备、服务器、数据库、中间件、应用共计节点近700
网络系统由政务外网、政务专网、社区村网络、财政网,四套网络组成
二、运维痛点分析
痛点一:
多网络环境运维复杂,缺乏统一管理平台
网信办现有政务外网、政务专网、社区村网络及财政网络等多套网络体系并行运行,网络结构复杂,设备数量众多,涉及多个职能部门管理
由于缺乏统一管理平台,各类设备需要通过不同系统进行维护,运维人员难以全面掌握整体网络运行状况,管理效率较低
痛点二:
网络结构复杂,故障定位效率低
当前缺乏自动化网络拓扑管理手段,设备之间的真实连接关系难以直观呈现
当网络故障发生时,需要依赖人工逐层排查,故障定位周期长,影响业务连续性
痛点三:
IT设备、应用系统缺乏统一监控
两个机房承载着大量业务系统,涉及服务器、数据库、中间件及应用服务等多个层级
目前各类资源监控分散,运维人员难以从业务视角全面掌握系统运行状态,当业务异常发生时,难以及时定位具体故障环节
痛点四:
告警管理能力不足
传统运维模式下主要依赖人工巡检和被动响应,缺少统一告警分析与主动预警机制
设备故障、性能异常及业务中断等问题无法及时通知相关人员,影响故障响应效率和服务保障能力
痛点五:
IP资源管理混乱
多套网络系统并行,网络终端数量庞大
IP地址资源管理主要依赖人工维护,无法准确掌握IP地址使用情况及终端接入位置,当出现异常终端或网络安全事件时,定位效率较低
痛点六:
缺乏统一历史分析与数据支撑
现有运维体系缺少统一的数据沉淀与分析能力,设备运行状态、性能趋势及故障历史难以长期保存和分析
管理人员缺乏客观数据支撑,难以为设备升级、容量规划及信息化建设提供科学决策依据
三、北塔软件智能运维解决方案
针对用户网络规模大、设备类型复杂、多网络环境并存等特点,北塔软件为用户建设统一智能运维管理平台,实现网络设备、安全设备、服务器、数据库、中间件、应用系统及IP资源的统一纳管与集中监控。
场景一:
构建统一监控体系
通过平台建设,实现对网络设备、安全设备的统一纳管,形成覆盖全业务环境的集中监控体系,有效提升运维管理效率
平台支持对100余家厂商、1600余种型号的网络设备、安全设备、服务器资源的监控管理,通过网络及协议,实现统一状态感知和性能监控
场景二:
网络拓扑可视化管理
针对复杂网络环境,平台支持多种采集模式,实现跨网络区域数据统一采集与集中管理
平台可自动发现网络中的交换机、路由器、防火墙等设备,并自动识别设备之间的真实物理连接关系,生成全网物理拓扑图
通过网络拓扑可视化展示,运维人员能够实时掌握设备分布情况、链路状态及网络结构,实现网络故障快速定位和影响范围分析
场景三:
全栈应用监控管理
平台覆盖操作系统、数据库、中间件及标准应用服务监控,实现从硬件层、系统层到应用层的全栈监控
通过业务关联分析能力,构建业务与IT资源之间的关联关系,实现业务运行状态可视化展示
场景四:
智能告警管理体系
平台建立统一告警中心,对设备异常、性能超阈值、链路故障及业务异常进行实时监测
支持短信、邮件、声音等多种告警通知方式,实现故障主动发现与快速响应,提升网络安全保障能力
场景五:
IP资源规划管理
平台通过自动采集交换机MAC表及ARP表数据,建立IP地址、设备端口及VLAN之间的映射关系
实现IP地址资源统一管理、终端快速定位、追溯和统计及网络资产可视化管理,提高网络安全事件处置效率
场景六:
历史数据与报表分析管理
平台提供强大的历史数据存储与分析能力,支持监控指标长期留存,可实现45万个KPI监控指标连续1年不压缩存储
同时提供丰富的数据分析与报表功能,支持按年、季度、月、周等维度进行趋势分析与历史回溯
通过长期运行数据积累,为设备扩容、网络优化、信息化建设规划及设备更新换代提供科学的数据支撑
四、运维成效
成效一:
构建起统一基础设施监控体系
通过北塔智能运维平台建设,实现了某网信办网络设备、安全设备、服务器、数据库、中间件及应用系统的统一纳管,打破原有多系统分散管理模式
平台兼容多个主流厂商设备,实现跨部门、跨平台集中运维管理,运维人员通过一个平台即可掌握全网IT资源运行情况,有效提升管理效率,降低运维复杂度
成效二:
构建起全网拓扑可视化管理体系
针对政务外网、政务专网、社区村网络及财政网等多套网络环境,平台自动发现网络设备及链路关系,生成真实物理拓扑图
通过网络拓扑可视化展示,网络架构、设备状态及链路运行情况一目了然。当设备或线路出现异常时,可快速定位故障节点及影响范围,大幅缩短故障排查时间,提高网络运行保障能力
成效三:
实现业务全栈运行状态可视化
平台对两个数据机房内的服务器、数据库、中间件及应用系统进行统一监控,构建起从基础设施到业务系统的全栈可视化管理体系
通过业务关联视图,运维人员能够直观查看业务系统与底层IT资源之间的依赖关系,实时掌握各业务系统运行状态,提升业务故障定位效率和业务连续性保障能力
成效四:
建立全天候智能告警体系
通过平台建立起统一告警中心,实现对设备异常、性能超限、链路中断及应用故障等事件的实时监测与自动告警
通过短信、邮件及声音等多种告警方式,确保故障及时通知相关运维人员,实现从“人工发现问题”向“系统主动发现问题”转变,有效缩短故障发现与响应时间,提高运维保障水平
成效五:
实现IP资源可视化管理
平台自动建立IP地址、MAC地址、交换机端口及VLAN之间的关联关系,实现IP资源统一管理与可视化展示
运维人员可快速查询终端接入位置、IP使用情况及设备归属信息,实现网络终端精准定位和异常终端快速追溯,提高网络安全管理能力和资源利用效率
成效六:
建立起运维数据中心与决策支撑体系
平台实现监控数据长期存储与统一分析,对设备性能、线路流量、告警事件等关键指标进行持续记录和趋势分析
同时自动生成设备运行、资源利用率、故障统计等运维报表,为网络扩容规划、设备升级改造及信息化建设决策提供数据依据,实现运维工作由经验驱动向数据驱动转变
五、运维总结
通过北塔智能运维平台建设,某网信办实现了IT基础设备及应用系统的统一监控与集中管理,构建了覆盖基础设施、业务系统和网络资源的一体化运维体系。平台上线后,有效提升了故障发现与定位效率,缩短了问题处理周期,降低了人工运维成本。
同时通过智能告警、IP资源管理及历史数据分析能力,为网络安全保障、信息化建设规划和业务连续运行提供了有力支撑,显著提升了信息化运维管理水平。