Finding Anomalies in Network System Logs with Latent Variables
Big-DAMA '18 Proceedings of the 2018 Workshop on Big Data Analytics and Machine Learning for Data Communication Networks
研究点的提出
系统日志可以帮助网络管理员识别网络上的异常内容,但是往往因为海量日志及其多样性的特征使得分析十分困难。在此提出了一种不需要特征提取和预处理的日志异常事件处理机制。
传统工作
首先按照消息类型(即日志模板)对日志进行分类,然后将它们视为统计时间序列,以便稍后通过统计分析进行处理。
传统基于特征选取,考虑环境,不适用于新环境
对比实验
知识点
自动编码器
-
无监督的神经网络模型,它可以学习到输入数据的隐含特征,这称为编码(coding),同时用学习到的新特征可以重构出原始输入数据,称之为解码(decoding)。
-
可以用于特征降维
-
变分编码器:生成模型,
-
条件变分自编码器:
论文内容
定义异常行为:时间序列行为偏离日志时间序列中的正常或通常状态
通过使用潜在变量将大量不同的数据嵌入隐藏状态
key idea: model log time series chara