大一暑假学习热情颇高却又贪多求快,囫囵吞枣地花了几天刷了一遍Python机器学习入门课程,很快就什么都不记得了。之后一年半多,也没有什么需要用到机器学习的地方,加上断断续续学了C++,连Python语法都快忘光了。
时隔近两年,这个blog要重新更新了。这次会在三周内更新完Python机器学习的内容,再花三个月左右的时间另起blog,更新吴恩达机器学习课程笔记和深度学习基础部分。希望Flag不倒!
注:本blog经过整理、简化,以便我自己复习和查找。下面这篇Blog课程笔记copy的比较全,可供听课时参考(以节约笔记时间)https://blog.csdn.net/linzch3/article/details/76038172
聚类:K-means算法
算法介绍:
k-means算法以k为参数,把n个对象分成k个簇,使簇内具有较高的相似度,而簇间的相似度较低。
算法流程:
- 随机选择k个点作为初始的聚类中心;
- 对于剩下的点,根据其与聚类中心的距离,将其归入最近的簇
- 对每个簇,计算所有点的均值作为新的聚类中心
- 重复2、3直到聚类中心不再发生改变
K-means算法实例
import numpy as np from sklearn.cluster import KMeans
KMeans的主要参数:
- n_clusters:用于指定聚类中心的个数
- init:初始聚类中心的初始化方法
- max_iter:最大的迭代次数
- 一般调用时只用给出