电网信息化

APM探针全程跟踪监控 让系统运行状态看得见

2024-09-10 10:19:32 国家电网报

8月29日,国网天津市电力公司信息通信公司完成全链路监测(APM)探针部署工作,共计安装4176个APM探针。这些探针的应用支撑该公司纳管能源互联网营销服务系统(以下简称“营销2.0系统”)、新一代电力交易平台、新一代设备资产精益管理系统、电网资源业务中台等9套信息系统,实现对系统微服务运行状态的实时监控。

APM技术是一种通过APM探针来监控系统运行状态、实时分析应用程序性能的技术手段。运用APM技术,从客户提出需求到系统处理完毕,系统运维人员可以全程跟踪监控,实时掌握系统运行状态,及时发现异常,快速解决系统问题,从而增强系统稳定性。

随着数字化进程不断加快,天津电力信通公司积极推进运维工作智慧化,使用APM技术加快构建营销2.0系统客户交费全链路监控场景。

营销2.0系统运维人员通过查看全链路监控大屏,掌握客户通过各渠道交费情况的变化趋势、各业务涉及的微服务接口调用响应时长变化趋势等。营销2.0系统自动绘制交费业务相关的微服务调用链路图。运维人员在监控大屏上可以直观地看到各微服务之间的调用关系。链路图通过颜色变化来区分微服务的不同状态,并高亮显示异常的微服务,让系统运维人员能够直观感知各渠道中欠费信息查询、交费场景等微服务的运行状况。

“以前我非常担心系统出现故障影响客户交费。应用APM技术后,我们可以完整监控系统运行的全部环节,让系统运维人员先于营销业务人员发现系统故障,为故障处置争取了大量时间。同时,在营销2.0系统升级检修时,APM技术可以帮助运维人员查找系统运行异常的原因,包括微服务更新后新数据库语句执行计划不优、微服务代码异常报错等,大幅降低了系统升级后出现故障的概率。”营销2.0系统运维人员张琦佳介绍。

截至目前,APM技术已成功定位营销2.0系统运行异常20余次,辅助优化其他8套信息系统的多项性能指标。(刘熠华 佘梅绮 林华)


北极星智能电网在线官方微信

相关推荐

加载中...