![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 59
花妖huayao
这个作者很懒,什么都没留下…
展开
-
西瓜书9.10:实现自动确定聚类数目的k_means算法
自动确定聚类数量的Kmeans方法 问题: 试设计一个能自动确定聚类数的改进k均值算法,编程实现并在西瓜数据集4.0上运行。 数据集: 西瓜数据集4.0 数据集描述: 该数据集共有30个样本,每个样本有密度和含糖度两个特征。 思路: 如何确定k的取值: 这里希望每一类别内部样本点距离较小而不同聚类之间的误差较大,所以用: 作为损失函数,其值原创 2017-12-11 09:24:52 · 7690 阅读 · 0 评论 -
isomap mds 实现
Isomap 和 mds 实现数据集:iris数据集描述:一共五个字段,前四个字段表示花的四个属性,最后一个字段表示花的类别。共有150组数据,三种类别Mds方法思路:首先计算任意两朵花的欧式距离结果放入disM2矩阵,接着计算B2,然后对B降维为m*2,得到result2矩阵。Isomap方法思路:首先计算任意两朵花的欧式距离结果放入disM矩阵,选取k=10,使得前k个最短路径原创 2017-10-08 10:41:41 · 712 阅读 · 1 评论 -
机器学习
用python实现了留一法和十折交叉检验来对iris和wine数据集进行三分类。算法实现起来不难,但是由于第一次写,迭代函数的封装性不好(因为假设了类别在最后一列)。主要注意的是十折交叉检验时候分层抽样。因为两个数据集都是比较整齐,一二三类分为三块。所以这里用数据集每一行元组的下标除以10的余数作为其所处的块数。其余就没有什么了。只是因为先做的iris,数据集数量特别好,就特别蠢的假设总数是10和类原创 2017-09-29 19:46:42 · 304 阅读 · 0 评论