![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 66
jwl892
这个作者很懒,什么都没留下…
展开
-
聚类--噪声去除
聚类算法中的噪声通常指的是一些被错误地分配到簇中的数据点,这些点可能是离群值(outliers)、异常点(anomalies)或者是噪声本身。基于距离的噪声移除方法:这种方法假设噪声点是距离其他数据点较远的点,因此可以通过设定一个距离阈值来移除距离大于该阈值的数据点。基于密度的噪声移除方法:这种方法的核心思想是在数据集中计算每个数据点的密度,并将低密度区域中的数据点视为噪声。基于专家知识的噪声移除方法:在某些情况下,领域专家可以提供关于噪声点的先验知识,这些知识可以用于检测和移除噪声点。原创 2023-04-14 13:32:21 · 1564 阅读 · 0 评论 -
支持向量机--处理非线性模型
如果样本集不是线性可分的,那么我们就不能像上面的处理方式一样求出www和bbb。1.最小化:{min12∥W∥2+C∑i=1Nσi⋯(1)s.t.yi[W⊤Xi+b]≥1−σiσi≥0\left\{\begin{matrix}min\frac{1}{2} \left \| W \right \|^2+C\sum_{i=1}^N \sigma _i \qquad \cdots(1) \\s.t. \quad y_i[W^{\top} \boldsymbol{X_i}+b] \ge 1-\sigma _原创 2022-12-25 21:12:54 · 279 阅读 · 0 评论 -
支持向量机(Support Vector Machine)--处理线性模型
如果存在一条直线,可以划分两个样本集,则必然存在无数条直线,那么哪条直线式最好的?如下图,三条直线哪条线式最好的?为什么?我们可以从不同的方面来讨论一下:(1)所有的特征向量最后的影响差不多: ①对x轴对应的特征进行划分,最好的一条线是L2; ②对y轴对应的特征进行划分,最好的一条线是L1。(2)对错误的容忍程度大小,最好的是L3。(因为左上角的点下移,右下角的点上移,都会造成误差,如下图)原创 2022-11-19 00:54:01 · 463 阅读 · 0 评论