博睿数据携手电信云,为客户保驾护航,提升用户满意度 Bonree NET监测帮助电信云构建高质量的性能监测体系,及时的故障预警和快速解决方案。
方案预期
主动发现线上业务的存在问题,通过全面的数据,快速定位问题,节省IT运维时间50%,提升用户体验;在出现故障时能第一时间知晓,变被动为主动,快速定位问题,缩短故障处理时间,提升用户体验及用户转化率;CDN对比选型过程中,有针对性的优化调度策略以及CDN节点性能,从而提升测试质量。
利用部署在全国各地的监测网络,结合博睿数据特有的灵活性报警规则,可以按照不同需求,完成用户的报警需求,并可有效控制误报情况 CDN解析覆盖调优,通过各区域运营商用户实际体验,调优CDN节点解析调度 通过博睿产品的劫持监测,对所加速的域名DNS解析过程进行全方位的分析,准确快速定位问题点
故障分析
事件:湖北仙桃电信可用性严重报警
排查过程:电信云技术人员将通过使用博睿监测产品对湖北仙桃电信的监测数据分析,发现访问报大量的“播放流未找到”错误,访问的目标主机IP: 116.211.76.126 ,协调后台专人处理,问题解决
瓶颈:环境单一,无法复现实际场景;CDN无法及时感知前端用户使用问题,不能及时获取到CDN节点是否能正常提供服务
事件:监测任务报大量的连接失败(602)错误,通过查看任务主机错误图,目标主机嘉兴电信(IP:115.233.62.12)发生大量的连接失败(602)错误
排查过程:电信云技术人员将通过使用博睿监测产品对错误数据进行分析,发现访问报大量的“连接失败”错误,访问的目标主机IP: 115.233.62.12 ,协调专人处理此问题,最终原因是服务器负载高所导致的,最后调整优化了负载均衡策略后得以解决
实现了用户端访问质量的量化及可视化,快速定位问题原因,MTTR减少66.7%
对各CDN的服务质量实现了有效的监控与管理
解决了部分地区可用性低的情况,湖北仙桃电信用户访问资源的可用性由最初的80.45%,通过优化调整,可用性提升至99.3%
遇到存在的隐患和性能问题,通过博睿的报警机制,快速发现问题,直接的定位到具体原因,节省大量人力物力及沟通成本