异常值检测方法

最新推荐文章于 2024-07-13 19:01:07 发布

云博士的AI课堂

最新推荐文章于 2024-07-13 19:01:07 发布

阅读量530

点赞数 5

分类专栏：人工智能(AI)技术入门与实践文章标签：异常值检测异常值

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/l35633/article/details/136112740

版权

人工智能(AI)技术入门与实践专栏收录该内容

77 篇文章 1 订阅

订阅专栏

本文概述了在IT领域中常见的异常值检测技术，包括Z分数法、箱线图、马哈拉诺比斯距离、孤立森林、LOF、K近邻、HBOS、椭圆Envelope和One-ClassSVM等统计与机器学习方法，以及深度学习在异常值检测中的潜在应用。

摘要由CSDN通过智能技术生成

1. Z分数法（Z-Score）：

基于数据点与数据集均值之间的标准差的差异来识别异常值。通常，Z分数大于或小于某个阈值（例如3）的数据点被认为是异常值。

2. 箱线图方法（Box Plot）：

使用箱线图可以直观地检测异常值。异常值通常是箱线图上下边界之外的数据点。

3. 马哈拉诺比斯距离（Mahalanobis Distance）：

基于多变量数据的马哈拉诺比斯距离来测量观测值与数据集的距离。距离远离数据集中心的观测值可能被认为是异常值。

4. 孤立森林（Isolation Forest）：

孤立森林是一种基于树结构的算法，它通过构建随机树来识别异常值。孤立森林倾向于将异常值孤立在树的较短路径上。

5. LOF（局部离群因子，Local Outlier Factor）：

LOF算法度量了数据点与其附近数据点的密度差异，从而识别异常值。密度较低的点可能被视为异常值。

6. K近邻算法（K-Nearest Neighbors）：

基于K近邻的方法可以通过比较一个数据点与其最近的邻居来识别异常值。如果一个数据点与其邻居差异较大，它可能是异常值。

7. HBOS（直方图基于离群值得分，Histogram-based Outlier Score）：

HBOS使用直方图来计算每个数据点的异常值得分。得分较高的数据点被认为是异常值。

8. Elliptic Envelope：

这是一种基于椭圆模型的方法，它假定数据符合多变量高斯分布，并尝试识别与该模型不匹配的数据点。

9. One-Class SVM（支持向量机）：

One-Class SVM是一种监督学习算法，它用于学习数据集的正常数据的边界，并识别与这些边界不一致的数据点。

10. 基于深度学习的方法：

深度学习模型如Autoencoders和Variational Autoencoders也可以用于异常值检测，通过重建数据来识别异常值。

云博士的AI课堂

关注

5
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
异常值检测方法

机器学习中常见的10种异常值检测的方法。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。