数据分析
一碗风
矫情的人
展开
-
Kmeans算法及其示例
Kmeans算法Kmeans是简单的聚类分析算法。其常用在数据分析与人工智能中。简单说,Kmeans算法就是把一个集合中的东西分为若干子集,这几个子集内的元素具有空间相近或者特点相近。做法:1. 随机选取K各中心点,生成对应的k个簇。2. 遍历所有的数据点,依据“距离’”将每一个数据点划分到最近的中心点所在的簇。3. 计算每个簇所有的数据点的平均值原创 2017-05-25 14:48:07 · 25262 阅读 · 2 评论 -
PCA
Principal Component Analysis(PCA)算法。降维是对高维数据去除不重要特征与噪声,只保留重要特征的方法,会损失一定信息。目录优点:基本原理PCA推导基于最大化投影后方差基于最小投影距离PCA Code(python)Ref优点:减少变量数量,有利于发现规律。高维空间具有稀疏性,希望数据变得更加稠密,降低计算开销。某种程...原创 2019-02-11 13:40:22 · 425 阅读 · 0 评论