自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 聚类--噪声去除

聚类算法中的噪声通常指的是一些被错误地分配到簇中的数据点,这些点可能是离群值(outliers)、异常点(anomalies)或者是噪声本身。基于距离的噪声移除方法:这种方法假设噪声点是距离其他数据点较远的点,因此可以通过设定一个距离阈值来移除距离大于该阈值的数据点。基于密度的噪声移除方法:这种方法的核心思想是在数据集中计算每个数据点的密度,并将低密度区域中的数据点视为噪声。基于专家知识的噪声移除方法:在某些情况下,领域专家可以提供关于噪声点的先验知识,这些知识可以用于检测和移除噪声点。

2023-04-14 13:32:21 1444

原创 聚类--相似性度量矩阵

对于Pearson相关系数,可以先将数据集中的每个数据点表示为一个向量,然后计算每对向量之间的Pearson相关系数,得到一个相关系数矩阵。对于余弦相似度,可以先将数据集中的每个数据点表示为一个向量,然后计算每对向量之间的余弦相似度,得到一个相似度矩阵。以上是常见的几种构造相似性度量矩阵的方法。需要注意的是,在进行聚类分析时,选择合适的相似性度量方法和相应的相似性度量矩阵非常重要,它们将直接影响聚类结果的准确性和可靠性。聚类的相似性度量矩阵是一个对称矩阵,它的每个元素表示两个数据点之间的相似性度量。

2023-04-14 13:23:01 1187

原创 支持向量机--处理非线性模型

如果样本集不是线性可分的,那么我们就不能像上面的处理方式一样求出www和bbb。1.最小化:{min12∥W∥2+C∑i=1Nσi⋯(1)s.t.yi[W⊤Xi+b]≥1−σiσi≥0\left\{\begin{matrix}min\frac{1}{2} \left \| W \right \|^2+C\sum_{i=1}^N \sigma _i \qquad \cdots(1) \\s.t. \quad y_i[W^{\top} \boldsymbol{X_i}+b] \ge 1-\sigma _

2022-12-25 21:12:54 267

原创 支持向量机(Support Vector Machine)--处理线性模型

如果存在一条直线,可以划分两个样本集,则必然存在无数条直线,那么哪条直线式最好的?如下图,三条直线哪条线式最好的?为什么?我们可以从不同的方面来讨论一下:(1)所有的特征向量最后的影响差不多:​ ①对x轴对应的特征进行划分,最好的一条线是L2;​ ②对y轴对应的特征进行划分,最好的一条线是L1。(2)对错误的容忍程度大小,最好的是L3。(因为左上角的点下移,右下角的点上移,都会造成误差,如下图)

2022-11-19 00:54:01 455

原创 KNN算法

通过一些转换函数将特征数据转换成更加适合算法模型的特征数据过程。

2022-11-13 18:01:12 538

原创 一些常用python生成

一些常用的python生成

2022-10-30 22:49:27 70

原创 【列空间(column spaces)】

在研究一些矩阵性质的时候,可能会用到column spaces,从一个矩阵转移到另一个矩阵上去。

2022-08-09 17:09:59 600 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除