机器学习 --- 异常检测

最新推荐文章于 2022-10-28 11:48:50 发布

micklongen

最新推荐文章于 2022-10-28 11:48:50 发布

阅读量281

点赞数

分类专栏： # 机器学习文章标签：机器学习人工智能 c语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/micklongen/article/details/120926989

版权

机器学习专栏收录该内容

13 篇文章 0 订阅

订阅专栏

机器学习 - 异常检测

概述

目标
- 判断预测的数据，跟训练数据的相似程度
应用场景
- 金融欺诈行为：正常刷卡行为 VS 盗刷
- 网络入侵检测
- 癌细胞检测

二分类模型

困难
- 异常数据无法穷尽
- 异常数据很少

有标签数据

流程
- 输入
- 输出
  - 类别
  - 可信度（可能是 0 ~ 1 的浮点数）
- 阈值设置
  - 通过设置阈值，判断数据是否异常阈值的设定基于实际情况而定
算法
- 神经网络
算法评估
- 验证数据：数据，以及标注该数据是否正常（不是具体的分类）
优化点
- 通过对抗神经网络，生成异常数据

无标签数据

场景类别
- 所有数据都是正常数据
- 数据中包含很小比例的异常数据
算法
- GMM（Gaussian Mixture Model）
  - 核心思想
    - 基于特定的分布，求概率低概率就是异常
  - 步骤
    - 假定一个分布（比如说高斯分布）
    - 计算均值、方差
    - 基于均值、方差，求概率
    - 设置阈值，判断是否异常
- Auto-Encoder
  - 模型结构
    - Input -> nn -> code -> nn -> output
    - input 和 output 尽可能的靠近
  - 预训练
    - 训练数据为正常数据
  - 生产运行
    - 如果 input 和 output 不够靠近，则认为是异常数据
- PCA
  - 可以做多次投影
  - 对于无法分来的数据，被认为是异常数据
- 孤立森林
  - 最早被分开的数据，被当做异常数据
- OneSVM

应用场景

图像
- AnoGAN
- EGBAD
- GANomaly
语音
- GMGAN

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习 --- 异常检测

机器学习 - 异常检测概述目标判断预测的数据，跟训练数据的相似程度应用场景金融欺诈行为：正常刷卡行为 VS 盗刷网络入侵检测癌细胞检测二分类模型困难异常数据无法穷尽异常数据很少有标签数据流程输入输出类别可信度（可能是 0 ~ 1 的浮点数）阈值设置通过设置阈值，判断数据是否异常阈值的设定基于实际情况而定算法神经网络算法评估验证数据：数据，以及标注该数据是否正常（不是具体的分类）优化点通过对抗神经网络
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。