博睿数据APM+博睿数据APM+NPM解决方案,基于获取每一笔交易在经过各个应用、主机、交换机时的异常次数和响应耗时等重要指标,实现关联分析,结合应用节点、网络设备节点,形成全程全网交易路径图
业务中一条请求会通过网络设备和应用节点,通过 traceID 将整条链路的各个节点进行关联。当一条请求经过入口应用时,入口应用会产生 traceID,并将traceID 埋在 Http 的请求头及响应头中,APM 及 NPM 会分别解析请求和响应头中的 traceID,然后将关联 traceID 的请求数据结合起来,即可绘制 A+N 全链路拓扑
APM
应用性能监控
通过博睿数据解决方案的服务端应用性能管理平台,太平金科的业务保障运维团队可以获取业务拓扑、应用拓扑清晰展现逻辑关系,并全面实时掌握业务质量。同时,通过流程下钻,业务保障运维团队可以详细监控入口业务的请求量、业务的平均响应时间及错误,通过曲线图可查看整体概览把控业务健康状况
数据库SQL优化
“开局之战”活动前夕,通过方案中的压测平台,太平金科构建了真实业务场景进行测试,并发现部分业务超时。为此,在APM_Server平台数据库功能中,太平金科的业务保障运维团队针对SQL做了具体分析,并最终下钻定位到了具体业务系统,从而可以联系对应保障人员进行快速处理,对SQL进行进一步优化
经过太平金科业务保障运维团队的努力,最终应用系统不仅性能较之前有明显提升,同时也保障了应用前端的出单质量和出单速率
主机监控
现在,在业务进行期间,太平金科的业务保障运维团队可以通过基础监控功能查看业务主机的具体使用状况、及时发现、及时告警、及时处理
负载策略监测
利用博睿数据的解决方案,运维团队可以通过应用探针筛选对应的服务/集群,查看当前业务的吞吐率,进而检测负载策略
NPM
网络性能监控系统主要用于对业务性能数据、用户访问数据及网络性能数据进行监控。在太平金科所采用的的“A+N”一体化解决方案中,保障运维团队实现了数据的关联分析, 能够透析业务应用与性能之间的影响
通过IP/域名+端口+VLAN标识的不同“标签”,太平金科的保障运维团队将流量进行了拆分,划分了对应具体业务,同时,为保证高可用性,方案还采用了主备方案,不仅使得两地系统双活而且还可以在同一平台同时处理
大屏展示
通过对Bonree Dataview的定制化量身改造,太平金科的运维大屏可以实时刷新、跟踪底层运维数据,这使得保障运维团队可以直观了解到当前业务系统的健康和业务展现趋势
实现应用性能数据的全面收集及可视化
可以对代码运行效率进行底层监控和问题剖析
精准定位业务慢请求原因
快速定位问题,划分责任域,解决问题
从网络层到应用层整体数据分析