![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 79
机器学习
且听风吟hjc
在学,在看,会有错
展开
-
泰坦尼克号幸存者预测
发现Age(年龄)、Fare(票价)、Cabin(船舱号)、Embarked(上船地点)存在缺失,需要进行补充。对于登船港口(Embarked),分别计算出各个类别的数量,采用最常见的类别进行填充。对于船舱号(Cabin),由于缺失的数据太多,将缺失的数据用’U’代替,表示未知.通过corr()进行特征选取,构造相关矩阵研究变量之间的相关关系,然后再提取特征,对矩阵中 Survived 那一列输出。对于客舱号(Cabin)的处理(与Name 类似),从客舱号中提取客舱类别并进行 one-hot 编码。原创 2023-10-14 21:23:37 · 560 阅读 · 1 评论 -
SVM实现人脸识别
在jupyter遇到 UsageError: Line magic function `%%time` not found.时,要把%%time放在这个代码块的首行顶格。其中的C代表的是惩罚系数,用来防止过拟合,我们先用默认的初始值测试下性能。由于原来的数据很大,而且数据量多,我们首先对原始数据进行PCA降维。导入sklearn中的人脸数据,需要越过那堵墙,否则会报错。然后我们随机加载50张图片,并可视化查看预测结果。预测错误占比:5/50,大大提升了准确率。预测错误占比:16/50。原创 2023-11-03 20:50:31 · 385 阅读 · 0 评论 -
K-means聚类算法实现鸢尾花聚类
聚类是一个将数据集中在某些方面相似的数据成员进行分类组织的过程,聚类就是一种发现这种内在结构的技术,聚类技术经常被称为无监督学习。k均值聚类是最著名的划分聚类算法,由于简洁和效率使得他成为所有聚类算法中最广泛使用的。给定一个数据点集合和需要的聚类数目k,k由用户指定,k均值算法根据某个距离函数反复把数据分入k个聚类中。K-means算法是典型的基于距离(欧式距离、曼哈顿距离)的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。,x_n)和y= (y_1,y_2,…原创 2023-11-01 21:36:33 · 3035 阅读 · 2 评论 -
SVM-支持向量机
对偶理论是一种将一个优化问题转化为另一个优化问题的方法,其中两个问题都有相同的最优解。原始问题是我们想要解决的问题,而对偶问题是通过对原始问题进行一些数学变换得到的问题。也就是说可以将一个复杂的优化问题转化为一个更简单的问题,这有助于我们更好地理解和解决问题。将样本从原始空间映射到一个更高维的特征空间, 使样本在这个。我们使它向上平移和向下平移,触碰到样本的距离,间隔相等。现实中很难确定合适的核函数,使训练样本在特征空间中线。在样本空间中寻找一个超平面, 将不同类别的样本分开。高维特征空间使样本线性可分。原创 2023-11-13 15:21:55 · 22 阅读 · 0 评论