无监督学习-异常评估

最新推荐文章于 2023-07-30 11:31:06 发布

永远鲜红の幼月

最新推荐文章于 2023-07-30 11:31:06 发布

阅读量401

点赞数 1

分类专栏：机器学习入门科普文章标签：机器学习

本文链接：https://blog.csdn.net/qq_40482358/article/details/118518448

版权

机器学习入门科普专栏收录该内容

11 篇文章 0 订阅

订阅专栏

异常评估

异常评估是针对之前的无监督学习得到的结果，若产生了区别于以构建好的阳性模型（即产生阴性结果。发出异常。

引入样例

$\begin{aligned} & 假如一个二维数据集\{x^{(1)},x^{(2)},...,x^{(m)}\}，其分布样例如下所示\\ & 新增一个训练集x_{test},查看新增效果。 \end{aligned}$

在这里插入图片描述

看到给出一个新的测试x，在某些情况内是正确(OK)，但在某些情况内可能是异常的(anomaly)。
$\begin{aligned} 给出判定过程:&\\ & x^{(i)}是第i个特征。\\ & 得出该特征相对于样本的分布概率p(x)\\ & 检查p(x)<\varepsilon \end{aligned}$

高斯分布

对于高斯分布
$\begin{aligned} & 给定一个训练集\{x^{(1)},x^{(2)},...,x^{(m)}\},x\in\mathbb{R}^n\\ & 要求出多维下的联合概率，即p(x)=\prod_{j=1}^n p(x_j,\mu_j,\sigma_j^2)\\ & 需要先求出\mu_j=\frac{1}{m}\sum_i^m x_j^{(i)}\qquad \sigma_j^2=\frac{1}{m}\sum_i^m(x_j^{(i)}-\mu_j^{(i)})^2\\ & 对于一个新的样本x，计算p(x)判断p(x)<\varepsilon \end{aligned}$

评估异常检测算法

评估方法仍可以是之前的机器学习算法评估标准

真假阳性与阴性
精确度和召回率
之前提到的

注意选择合适的ε

异常评估与监督学习的比较

异常评估是在样本不符合期望时进行报错，之后再根据情况进行调整。

监督学习是有着y的，当1和0的差距过于悬殊之后，可能就效果不好

训练集限制
- 异常评估可以有较少的阳性点进行误差判断，
- 监督学习样本最好阳性阴性相接近。

调整为合适的高斯分布

非高斯分布

通过对变量取对数，取次方来使其倾向于高斯分布

联合高斯分布

看一种情况。

在这里插入图片描述

x1和x2的高斯分布如右图所示。联合起来的图像如左图所示。

现在新加入一个样例x，若该x在左上。那么我们在单独的高斯分布上，似乎每一个都没有太过偏离。期望仍是不错的。

但是很明显这是一种错误的情况。如左图所示，独立的高斯分布给出的结果是如同心圆一样，但是这里的两个变量x1，x2是存在相关性的，因此要考虑相关性的联合高斯分布。
$对于x\in\mathbb{R}^n的样本，\mu\in\mathbb{R}^n,\sum\in\mathbb{R}^{n*n}\\ p(x;\mu;\sum)=\frac{1}{(2\pi)^{\frac{n}{2}}|\sum|^{\frac{1}{2}}}\exp(-\frac{1}{2}(x-\mu)^T\sum \!^{(-1)}(x-\mu))\\ \mu=\frac{1}{m}\sum_{i=1}^mx^{(i)}\qquad\sum=\frac{1}{m}\sum_{i=1}^m(x^{(i)}-\mu)(x^{(i)}-\mu)^T\qquad（类似主成分分析）\\ 判断p(x)<\varepsilon$

联合高斯与独立高斯区别

可以看一下公式
$p(x)=\prod(x_j;\mu_j;\sigma^2_j)\\ 联合高斯：p(x;\mu;\sum)=\frac{1}{(2\pi)^{\frac{n}{2}}|\sum|^{\frac{1}{2}}}\exp(-\frac{1}{2}(x-\mu)^T\sum \!^{(-1)}(x-\mu))\\ 这里的\sum就是那个\sigma^2矩阵。$

训练集区别
- 独立高斯，可以在训练集m较小的时候使用。
- 联合高斯需要m>n，即训练集大小m > 特征数n。或者Σ可逆。
特征的区别
- 独立高斯，特征值需要独立，例如上面的x1和x2，需要将其合并为x3=x1/x2.
- 联合高斯，可以直接计算，上面的Σ就是协方差矩阵，经过变换可以独立。

参考资料

B站吴恩达机器学习相关课程：https://www.bilibili.com/video/BV164411b7dx

永远鲜红の幼月

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
无监督学习-异常评估

异常评估异常评估是针对之前的无监督学习得到的结果，若产生了区别于以构建好的阳性模型（即产生阴性结果。发出异常。引入样例假如一个二维数据集{x(1),x(2),...,x(m)}，其分布样例如下所示新增一个训练集xtest,查看新增效果。\begin{aligned}& 假如一个二维数据集\{x^{(1)},x^{(2)},...,x^{(m)}\}，其分布样例如下所示\\& 新增一个训练集x_{test},查看新增效果。\end{aligned}假如一个二维数据集{x(1)
复制链接

扫一扫

专栏目录