基于深度学习的移动网络异常检测


1、文章信息

文章题为《Detection of mobile network abnormality using deep learning models on massive network measurement data》,是发表在Computer Networks期刊上的一篇关于网络异常检测的文章。


2、摘要

近年来,随着移动网络用户地不断增长,基于专家经验和阈值分析的传统方法已经难以满足网络维护的需要。这些传统的方法暴露出许多弱点,如主观性、差异性和不一致性。

  • 主观性具体:专家在分析网络时,主要关注投诉最多的移动网络小区(Mobile Network Cell),进行主观判断,会忽略一些潜在异常小区。

  • 差异性:有时专家可能会得出不同结论,若没有一个标准,很难得到一个统一的结论。

  • 不一致性:由于一些移动网络单元可能会自动恢复,专家的判断可能会随着时间的推移而失效。此外,专家系统通常需要很长时间才能产生结果。

本文提出了一种利用海量移动数据替代专家系统的深度学习方法(VAE/LSTM+XGBoost)。利用网络测量数据伪标签对监督学习模型进行训练,帮助深度学习模型进行特征选择。通过大量的实验和分析,证明了该方法在异常检测方面的有效性,并取得了比传统专家系统更好的性能。如下图所示,对比了传统的检测方法以及文章提出的检测方法。

2c30aa5fa310a247e4f376d9dbb0be32.png


3、文章结构

  1. 首先提出了在网络异常检测中常用的专家检测方法的缺陷与不足,并分别介绍了传统的网络异常检测模型,基于深度学习的异常检测方法,以及SDN(Software-Defined Networking)检测方法。同时提出了本文的基于深度学习的异常检测模型。

  2. 描述了数据的获取与预处理的方法,以及定义了如何判断网络异常。

  3. 提出了基于深度学习的网络异常检测模型。

  4. 输入具体数值,验证模型的有效性。


4、模型结构

方法的整体流程如下所示。

0763e88cbe6ee165ec963a5a93a746eb.png

数据处理模块(Data Collection),收集了大量的测量数据,文章设计了一个测量数据计数结构,用于收集不同的LTE cells的测量数据,该结构如下图所示。

f0098f36ff52b78f87ed0aa37eac85c4.png

每个测量结果来自一个特定的Measurement Object,每个Measurement Object由多个Measurement Unit组成。共有四种收集方式:累计计数器(收集数据的累积值,如RRC connection establishment attempts);动态计数器(收集动态变换的数据,如E-RAB建立的最长时间);DER (Discrete Event Registration)(如平均E-RAB设置时间);状态检测(收集类似于平均E-RAB连接时间的数据)

伪标签生成模块(Pseudo-labels Generation)与XGBoost Training模块,LTE cells多维异常检测的一大难题就是缺乏标签,在处理好缺失值之后,文章通过伪标签生成和非监督的方式(即XGBoost)解决这一问题。具体步骤,首先,使用6西格玛规则检测21项指标(经过预处理后得到的目标指标)中哪项在历史上(过去一周或今天)有异常。然后,利用模拟的专家规则判断移动网络小区是否存在异常。如下图所示。

9073c57b6a7f256844ed7e0816255d0d.png

处理好的伪标签,用于训练XGBoost(Extreme Gradient Boosting)。(XGBoost是一种集成树模型。该算法采用boosting方法对多个弱树模型进行序列训练,并使用损失函数的负梯度来拟合当前模型的残差。)

特征选择(Feature Selection),在训练好XGBoost之后,文章通过重要性得分(Important Score)来选取所需的特征。该得分可以直接获取,即若一个特性(feature)对分裂点的性能提高得越大(即,离树的根节点越近),其重要性得分就越高。

深度学习模块(Deeplearning Model)与拟专家规则模块(Simulated expert rule),深度学习部分主要采用VAE与LSTM。VAE是一种神经网络,经常用于重构未标记数据,也是一种包含变分网络和生成网络的生成神经网络模型,其结构如下图所示。

9c6de54da2c3df60f07e5f97e347c1fc.png

文章考虑到LSTM是前向传播,在训练时增加了额外的24小时数据。LSTM结构如下图所示。

da9b052a0f83b3ceb7d5d7d36984b7a5.png

文章使用VAE和LSTM来生成多维指标的期望值。通过计算期望值与历史值之间的绝对误差,可以得到异常指标。整个过程如下图所示。

e87309f7fdd4c800d978ed5c497f82b8.png


5、实验结果及分析

文章提出了一种新的检测指标Corr来评价检测异常的能力,通过构造两个集合,一个集合存储所有异常单元,一个集合存储所有正常单元,计算两个协方差,在计算比值即可得到。其具体反映了异常细胞组与正常细胞组的周期性差异的平均程度。

9bb3f9aeec57bf00247150e9ff569c22.png

其中Rn代表正常单元构成的集合,Ra代表异常单元构成的集合。

文章从两个角度验证了模型的有效性:一致性改进性

一致性是指文章提出的方法的大部分结果与专家系统一致,差异在合理范围内。在本部分中,我们使用6 西格玛的结果作为事实(ground truth)来计算精度和混淆矩阵。

改进性是本文的另一个关键评价指标,表明该方法在异常检测方面比专家系统有更好的性能。本文使用评价指标Corr和对样本的可视化分析来证明我们的方法对潜在的异常细胞有更强的检测能力。

文章最后选取21个特征中的19个作为有效特征,进行验证,baseline为专家系统,结果如下。

4e3aa047316b23c578bb12af759bb5d3.png

4fa9254ff076e7648649fccb6a0e4b2f.png

c7ba5fe80fdfd3c97fefe5d1a9b5801d.png

Attention

如果你和我一样是轨道交通、道路交通、城市规划相关领域的,可以加微信:Dr_JinleiZhang,备注“进群”,加入交通大数据交流群!希望我们共同进步!

  • 1
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
基于AI(人工智能)智能运维可视化平台解决方案 2 0 2 0 基于AI(人工智能)智能运维可视化平台解决方案全文共46页,当前为第1页。 面向不同人员的场景可视化示例 基于AI(人工智能)智能运维可视化平台解决方案全文共46页,当前为第2页。 1. 从人工到人工智能 2. 用人工智能点亮您的IT数据 3. 迈出AIOps的第一步 目 录 Contents 基于AI(人工智能)智能运维可视化平台解决方案全文共46页,当前为第3页。 Part 1 从人工到人工智能 基于AI(人工智能)智能运维可视化平台解决方案全文共46页,当前为第4页。 当前运维和业务团队面临的困境 不是没有数据,而是数据太多 不是不想分析,而是无从下手 基于AI(人工智能)智能运维可视化平台解决方案全文共46页,当前为第5页。 从人工到人工智能 挖掘海量数据的业务价值 统一大数据分布式处理技术 智能算法与机器学习 业务系统将要发生什么? 主动响应的预防预测性管理 降低系统低效对业务的影响 多种分散独立监控工具 专业化专家型人才 业务系统已经发生了什么? 被动响应的故障恢复性管理 人工运维 AIOps 基于AI(人工智能)智能运维可视化平台解决方案全文共46页,当前为第6页。 什么是AIOps AIOps,即基于人工智能的IT运维(Artificial Intelligence for IT Operations) ,是由Gartner定义的IT运维管理新类别。 AIOps将服务管理、性能监测、自动化结合在一起,以实现持续洞察和改进的目标,并由大数据和机器学习技术进行支撑。 机器学习 大数据 平台 AIOps 商业价值 监测 (观察) 服务管理 (交互) 自动化 (行动) 持 续 察 洞 持 续 洞 察 持 续 洞 察 From Gartner's Report 基于AI(人工智能)智能运维可视化平台解决方案全文共46页,当前为第7页。 AIOps的四个核心能力 AIOps 对海量数据进行存储 通过智能算法在数据提取时和存储后进行分析 从不同的数据源中获取数据 对海量数据进行高效访问 基于AI(人工智能)智能运维可视化平台解决方案全文共46页,当前为第8页。 AIOps的技术栈 可视化 机器学习 算法 分析 计算 大数据 数据源 事件 日志 监控 工单 任务 全量,海量,多样性,复杂性IT数据 集中统一管理,历史数据存储,实时数据存储 数据建模,模式识别,趋势识别,故障隔离 智能化选择,异常检测异常定位,根因分析 算法自我修改演进,新算法创建 多维度,个性化,角色化,场景化展示 数据清洗,去重,过滤,关联,生成新数据 基于AI(人工智能)智能运维可视化平台解决方案全文共46页,当前为第9页。 AIOps的核心价值 故障发现 故障规避 故障止损 故障修复 异常检测 异常定位 根因分析 常预测 基于AI(人工智能)智能运维可视化平台解决方案全文共46页,当前为第10页。 AIOps将在5-10年内成为ITOM的主流技术 From Gartner's Report 基于AI(人工智能)智能运维可视化平台解决方案全文共46页,当前为第11页。 Part 2 用人工智能点亮您的IT数据 基于AI(人工智能)智能运维可视化平台解决方案全文共46页,当前为第12页。 OneAPM智能运维平台解决方案 服务器数据 存储数据 网络数据 应用数据 用户体验数据 流量数据 日志数据 交易数据 任意IT数据 OneAPM AIOps 大数据实时多维分析 机器学习 大规模事务处理 海量数据实时接入 服务分析 深度挖掘 场景可视化 多维指标告警 数据建模 基于AI(人工智能)智能运维可视化平台解决方案全文共46页,当前为第13页。 OneAPM智能运维平台的五个能力层次 发现 接入 存储 整合 梳理 关联 智能 分析 多维 展示 从哪里来 到哪里去 IT数据 基于AI(人工智能)智能运维可视化平台解决方案全文共46页,当前为第14页。 全栈IT数据发现与接入篇 基于AI(人工智能)智能运维可视化平台解决方案全文共46页,当前为第15页。 全栈IT数据的采集范围 监控对象 采集数据 IT系统 客户端 数据库 虚拟化 中间件 SaaS 传统架构 业务层 应用软件层 基础设施层 业务系统 云架构 硬件设备 PaaS IaaS 交易 业务流程 浏览器 移动APP 应用/微服务 应用代码 数据库服务 中间件服务 网络流量包 日志 虚拟化 网络 主机 机房环境 交易量 交易金额 交易成功率 页面加载时间 浏览器类型 用户IP 页面加载错误率 CDN质量 应用响应时间 应用吞吐量 应用错误率 单个服务响应时间 单个服务吞吐量 单个服务错误率 交易错误率 交易处理时间 …… APP页面响应时间 AP
智慧家庭是近年来物联网市场重点发展的一个题目,随著应用产品与功能越来越多元化,让云端运算工作量不断扩充同时也占用网路流量,也因此边缘运算在近期不断被强调其重要性,希望可以分担云端工作量。东芝也在MCU产品上也推出了语音辨识与播放的算法,可以在低阶版本的ARM M4核心中独立完成中、英、日文的语音关键字辨识并拨放对应需求的语音,此功能与云端语音辨识比较展现了四大优点 低延迟响应 高度保密性 更佳的抗噪能力 极小的硬体资源 细部说明如下,东芝语音识别因为完全由M4核心算法计算,不需要依靠云端资源除了系统简单外响应时间在200msec以内针对需要即时控制的产品有高度可靠性;东芝语音辨识算法是经过深度学习调适,除了辨识率高同时也有更佳的抗噪能力,若有特别场合的背景噪音也可以重新调适算法作辨识字典增加辨识率;硬体资源部分英文与日文仅仅需要150KB Flash Code size,中文则需要350KB Flash Code size,RAM的需求则在140KB以内,并使用SPI界面接收MEMS麦克风I2S音讯再以两组PWM界面驱动完成ADX语音播报的功能,以相当低阶的一般消费型MCU硬体资源即可完成了语音辨识与播放功能的设计。 本次方案我们使用东芝TMPM4G6F10FG MCU产品搭配语音辨识与播放功能的算法导入语音控制智慧窗帘应用,以TMPM4G6F10FG自动辨识语音指令后控制东芝TB67S279FTG马达驱动IC致使窗帘动作。TB67S279FTG为步进马达控制IC,产品特色如下 AGC(主动增益控制)技术:解决防止步进马达失步从而产生大量热量问题 ACDS(高级电流检测系统)技术: 东芝原创技术实现了高精度恒定电流的电机驱动,且无需使用外部电流灵敏电阻器也有助于缩小板尺寸和物料清单(BOM)成本 微步驱动技术: 微步驱动器可以通过逐步改变两个绕组的电流比率,以相比于基本步进角度更精细的步进角度旋转马达 异常检测技术: 热关断(TSD),过电流保护(ISD),上电重置(POR),电机负载开路(OPD) 设计说明: 语音控制命令: 规划指令定义与动作如下: 语音命令动作设计 控制启动播放"待命中",启动马达控制,20秒无任何动作回到休息模式 关闭窗帘播放"窗帘关闭中"->控制马达正转至线性滑轨终点->播放"窗帘已关闭" 全部打开播放"窗帘打开中"->控制马达反转至线性滑轨起点->播放"窗帘已打开" 光线太亮播放"等等"->控制马达正转线性滑轨1/10位置->播放"是否还太亮" 有点太暗播放"遵命"->控制马达反转线性滑轨1/10位置->播放"亮度足够吗" 语音辨识触发关键字建立与程式设计: 使用东芝Voice Trigger GUI工具(TMW_VT_TMG.exe)编辑关键字字典,如下图点选红框处执行程式,绿框处输入关键字的汉语拼音 将设计好的语音辨识关键字资料用下拉式功能表的”Generate”产生middleware所需的字典档案 对应程式设计如下 首先针对设计好的关键字设定threshold参数(数值0~1000)如下图,参数越大表示越容易通过但也增加误判率,参数可以依照环境与关键字互相间的相似性作调整设计 使用middleware算法函式可以取出语音辨识的资讯,将语音辨识资讯的ID(detect.keywordID)传入窗帘马达控制的函式已进行对应程式设计动作 窗帘控制动作设计 如第二步设计,设计好窗帘所对应语音指令所需要的动作函式将语音辨识ID传入就可以对应执行,窗帘启动后会纪录位置,开关窗帘由马达正反转(MOTOR_DIR)决定,gMotor_Target_Pos参数则是计算马达本次动作需要到达的位置,程式码如下: 驱动窗帘移动的线性滑轨实际测试后的极限位置设定如下参数,未来若更换不同线性滑轨都很容易修改,而窗帘部分开关的参数也可以调整 语音播放功能程式设计 语音播放部分必须先将播放语音录制后转出成C语言阵列提供函式定址做输出播放成语音,这边介绍两款工具,首先先使用CRI Atom Encoder将录制的语音档案转成ADX格式音讯档案,如下图将录制wav档设定为24KHz sampling rate(如绿框),在执行红框选项作转档 转档完成后再使用bin2txt转成C语言阵列格式提供程式使用,指令如下图 转档完成的C file(如下图红框处)必须将档案include到程式中,同时要宣告array的记忆体(开启C file的绿框处) 对应到程式码中如下图做include与记忆体宣告动作 完成后就可以使用criAtomPlayer_SetData函式在需要播放语音的地方撰写程式即可执行。 窗帘动作: 当语音辨识、语音拨放与马达动作参数都设计好后,语音控制智慧窗帘侦测到对应关键字语音就会自动完成动作,程式设计成motor_
深度学习在网络异常检测中被广泛应用。根据引用\[1\]中的文章,《Detection of mobile network abnormality using deep learning models on massive network measurement data》,深度异常检测方法通过神经网络学习特征表示或异常分数来进行异常检测。近年来,深度异常检测方法在解决各种现实应用中的挑战性检测问题方面表现出比常规异常检测更好的性能,这一点在引用\[2\]中也有提到。这些方法系统地审查了当前的深度异常检测方法及其解决挑战的能力。传统的网络异常检测模型、基于深度学习的异常检测方法以及SDN(软件定义网络检测方法都被介绍并讨论了其优缺点。因此,基于深度学习的异常检测模型在网络异常检测中具有很大的潜力。 #### 引用[.reference_title] - *1* *3* [基于深度学习的移动网络异常检测](https://blog.csdn.net/zuiyishihefang/article/details/121484509)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [深度学习 检测异常_深度学习用于异常检测:全面调查](https://blog.csdn.net/weixin_26632369/article/details/108175048)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

当交通遇上机器学习

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值