一.K-Means算法 (1)随机生成两个点(聚类中心) (2)簇分配 (3)移动聚类中心 防止算法落入局部最优解,初始化时应采取的方法: 最终选择代价函数里最小的作为结果,此方法仅适用于K很小的时候 肘部法则:用来确定k的数值(此方法通常不适应,通常会得到右图) 选择K值的最好方法是询问自己这个K的作用是什么,分类的目的 二.主成分分析算法(PCA) PCA主要是处理降维问题,是将数据点投影在拟合的直线上,线性回归是用x来预测y的值 算法过程 (1)需要均值标准化和特征放缩 (2)计算协方差 (3)算法实现过程 (4)从n维降到k维 如何选取K 逆过程:低维到高维 使用PCA的过程