异常检测算法之LOF算法

最新推荐文章于 2024-06-11 10:24:50 发布

lgshowtime

最新推荐文章于 2024-06-11 10:24:50 发布

阅读量3.1k

点赞数

分类专栏：机器学习文章标签： sklearn python 机器学习数据分析

本文链接：https://blog.csdn.net/lvguangxv/article/details/120006987

版权

机器学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

本文介绍了LOF算法，一种基于密度的非监督异常检测方法，重点讲解了其工作原理、如何利用sklearn实现，并以IDS入侵数据集为例展示了在APT恶意流量检测中的应用。提到训练时间较长且不支持GPU加速的问题。

摘要由CSDN通过智能技术生成

异常检测算法之LOF

- 首先了解什么是LOF算法

首先了解什么是LOF算法

LOF算法又叫局部异常因子算法，它是一种基于距离的异常检测算法，我认为该算法比较详细的博客如下：LOF.
lof 的主要思想如下：通过比较每个点p和其邻域的密度来判断该点是否为异常点，如果点p的密度越低，越有可能被认为是异常点。至于密度，是通过点和点之间的距离来进行计算的，点和点之间的距离越小，则密度越高；反之则就越低。

算法特点

LOF算法主要特点包括如下：
LOF是一种非监督式的算法
LOF是一种基于密度的算法
LOF算法适合对于不同密度的数据进行异常检测

最近在研究关于APT攻击的恶意流量数据的检测，我认为该方法可以应用到检测恶意流量的范畴。当然异常检测也可以属于二分类的范畴，正常和不正常。但是APT攻击的恶意流量数据较少，存在样本不均衡的问题，初步设想，先采用异常值检测的算法较为科学。

采用的数据集为IDS入侵2017的公开数据集，网址为https://www.unb.ca/cic/datasets/ids-2018.html
这个数据集周一采集的数据为正常数据，周二到周末为参杂了恶意流量的数据。

实现方法

基于python的sklearn的第三方库，进行实现，参数说明参考官网：https://scikit-learn.org/stable/modules/outlier_detection.html#outlier-detection

其中参数：novelty ：默认为 flase ，是否可以用来做新奇检测
lof算法模式两种对比

实践检验

将数据集中的周一正常数据给lof算法进行训练，然后用周二带有恶意流量的数据进行新奇点检测：

周二数据集进行验证
这种基于lof算法的新奇点检测明显的感觉就是训练时间较长，尤其是数据的维度较高时，会有很长时间的训练时间。sklearn好像还不支持GPU加速

lgshowtime

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
异常检测算法之LOF算法

异常检测算法之LOF首先了解什么是LOF算法算法特点实现方法实践检验首先了解什么是LOF算法LOF算法又叫局部异常因子算法，它是一种基于距离的异常检测算法，我认为该算法比较详细的博客如下：LOF.lof 的主要思想如下：通过比较每个点p和其邻域的密度来判断该点是否为异常点，如果点p的密度越低，越有可能被认为是异常点。至于密度，是通过点和点之间的距离来进行计算的，点和点之间的距离越小，则密度越高；反之则就越低。算法特点LOF算法主要特点包括如下：LOF是一种非监督式的算法LOF是一种基于密度的算
复制链接

扫一扫

专栏目录