蓝月亮精选料大全助力云化网络智能化,VIPKID亮

近日,第十一届中国系统架构师大会在京召开,来自互联网、金融、在线教育、电商等领域的100余位技术精英参会,带来了一场最具价值的技术交流盛会。在线教育企业VIPKID基础架构部基础平台负责人杨志强受邀出席,并分享了VIPKID烽火台系统在自动识别风险故障、进行根源分析和提前预测,以及创新性解决监控数据的采集通路过长等方面的实践经验。

蓝月亮精选料大全 1

随着云化网络的复杂性和解耦性增强,云化网络重构将给网络运营和运维带来巨大挑战,5G技术变革也将对云化网络上的垂直业务带来革命性的改变。如何应对云化网络智能化运维,满足用户需求快速的变更并为垂直业务提供保障?如何保障网络基础设施层的稳定性和可靠性?如何感知网络并对网络进行全息监控,实现网络智能化调整?这些需求都催生了AI技术和大数据技术在云化网络智能化领域的应用。

VIPKID基础架构部基础平台负责人杨志强

自2013年成立至今,VIPKID平台用户数量实现了从0到70万的指数级增长,同时VIPKID的业务场景也产生了跨越式迭代。区别于其他教育平台,VIPKID具有跨全球、跨多云、高敏感、大规模、多模式的业务场景特点。此外,VIPKID平台围绕课堂构建的教材、IT-TEST、教师、家长、学生、LP、CC、客服等一系列业务复杂场景,也大大增加了VIPKID协作系统中故障发生的概率。

蓝月亮精选料大全 2

杨志强提出,智能化故障监控解决方案是对流量层、服务层、数据层的异常风险点进行全面数据采集和智能化监控,监控系统发出告警后会通过烽火台系统进行分发和送达,并实时发现持续的大颗粒风险,同时烽火台系统还会对告警大颗粒的风险进行筛选,对于持续的风险预警,将会升级成故障播报。此外,烽火台系统将通过分钟级故障播报、故障规则训练、智能化分析、自动化识别,产生自愈策略及自愈处理完成故障修复,并生成系统故障质量报告,通过运营周报通知所有研发同事,极大地减少了公司故障的发生。

作者 | 赖祖红

蓝月亮精选料大全 3

来源 | ZTe刊(A030100158)

VIPKID监控告警系统-天网系统

云化网络智能化的两个核心能力

针对现阶段告警发现、处理、协作、跟踪问题多,效率低下、无法量化的现状,杨志强认为告警的预测性和针对性至关重要。目前,VIPKID烽火台预警播报已实现了3分钟持续风险的提前预警、电话、短信、钉钉、邮件等多端播报及高效协作处置风险。其中,风险播报中心已制定了人工播报、系统播报、研发跟进三个阶段的运营策略,大大提升了问题发现率、播报及跟进效率。

实现云化网络的智能化需要具备两个核心能力,第一个核心能力是构建基础平台。这个平台必须解决两个事情,首先是云化网络智能化所需要的计算能力;其次是智能化所需要的数据处理能力,主要体现在如何从海量数据中提取有价值的样本数据。

此外,杨志强还对智能化运维中的告警智能化分析及智能告警方案设计进行了补充介绍,基于VIPKID基础架构部,团队构建了整个监控告警系统的设计架构——天网系统,目前已完成包括告警计算、风险预警播报、订阅中心、质量报告、告警统计、问题归因分析在内的烽火台告警分析。杨志强表示,未来将继续通过与大数据算法团队的共同协作开发故障定位系统,“希望通过天网系统实现更加完善的智能告警设计,提升告警系统的智能化水平,为小学员的每一节课保驾护航。”

第二个核心能力是场景化。云化网络场景化可以从三个层面理解:网络基础层、网络功能层和网络运维运营层。网络基础层关注网络的可靠性和稳定性,故障智能化定位就显得尤为关键。故障智能化定位涉及故障数据的海量采集、故障数据的关联、故障预测和故障自动化排除。网络功能层重点关注网络功能全息数据监控和感知,实现网络的自优化调整和网络功能自愈,通过海量数据采集、数据分析、数据AI模型建立应用和数据决策、数据反馈形成闭环。网络运维运营层面关注基于DevOps的智能化应用,包括网络自动化部署、网络弹性、故障定位等焦点问题。从运营角度来考虑,需要结合大数据进行数据挖掘分析,构建能给运营商带来有价值增长的场景,如流量智能化经营、网络用户体验评估、网络质量评估、网络跨界的端到端故障定位、业务开放快速构建新业务等。

AI 大数据驱动的云化网络智能化解决方案

从架构技术推动,场景切入作为考量,中兴通讯推出 AI和大数据智能化整体解决方案。方案基于三层云化网络的基础架构,推动云化网络的智能化。

蓝月亮精选料大全 4

基础设施层自优化:云化后的基础设施增加了故障定位和分析的难度,也为云化基础资源层的网络管理增加了复杂性,AI 大数据为引入故障告警、故障自愈、基础资源分配等自优化提供能力。

网络资源层智能化:引入网络状态感知网络功能,实现数据采集、状态监控、运算分析、推理决策和策略执行。AI 大数据为满足网络资源调配、网络自优自愈、网络自治化提供基础能力。

管理运维运营层自动化和智能化:从规划设计、网络部署到管理运维,实现自动化和全局资源优化等智能化。引入AI 大数据能动态地对网络进行资源调度、优化和故障排除,实现网络的智慧运营。通过将人工智能技术和网络资源调度相结合,利用机器学习技术根据采集数据对用户行为、网络业务及相应资源需求进行预测和评估,结合网络的动态情况进行主动运维,保障网络能够及时调整相应资源,实现网络资源的最大化利用。基于人工智能的网络优化技术,对智能网络特性的海量数据加以分析,建立合理的智能量化模型,并基于模型对网络业务进行实时处理,从而保证最佳的网络运行状态。基于人工智能的故障排除技术,基于海量历史故障数据和故障解决数据,利用人工智能学习生成故障事件和特征匹配规则库,针对网络告警数据自动选择最优解决方案,保障和管理好整个通信网络。

方案分阶段引入AI 大数据能力,从开环网络到静态闭环,再到动态闭环,最后到全自治网络,实现以人驱动为主的人治模式向网络自我驱动为主的自治模式的转变。

根据对智能化能力的不同要求,方案支持逐步引入大数据和AI能力。在云化网络智能化的分层架构中,越上层、越集中化,跨领域分析能力越强,更适合对全局性的策略集中进行训练及推理,比如跨域调度、端到端编排、全网内容分布等,通常对计算能力要求很高,需要跨领域的海量数据支撑,对实时性要求一般敏感度较低。越下层、越接近端侧,专项分析能力越强,对实时性往往有较高要求,比如5G NR的移动性策略、MEC的实时控制等,但对计算能力依赖度不高,一般适合引入嵌入式推理能力,或结合MEC,部署具备一定实时处理能力的轻量级训练引擎。

AI 大数据使能的智能化网络是5G网络发展的重要趋势,智能化将带来网络根本性的变革。首先依托网络大数据与机器学习算法的支撑实现5G网络的初级智能化;其次AI将可以学习跨领域的5G网络大数据,部分子领域将出现融合智能,实现5G网络的中级智能化;最后随着人工智能技术高度发展,网络各子领域大数据将实现全网联动和高度自治,大幅提升网络全生命周期效率,基于人类控制网络的意图实现网络的高级智能化。可以预见,在不久的将来,AI技术和大数据的结合将推动电信网络划时代的发展和演进。

本文由蓝月亮免费资料发布于蓝月亮精选料大全,转载请注明出处:蓝月亮精选料大全助力云化网络智能化,VIPKID亮

TAG标签: 蓝月亮二四六
Ctrl+D 将本页面保存为书签,全面了解最新资讯,方便快捷。