1.PCA主成分分析,去掉无用或冗余特征:
最大方差理论:
在信号处理中认为信号具有较大的方差,噪声有较小的方差,信噪比就是信号与噪声的方差比,越大越好。
最小平方差
理想情况:最大方差+最小平方差 ->合理的降维后的特征。
http://www.jianshu.com/p/4528aaa6dc48
2.K均值聚类
K-Means算法步骤
- 随机初始化 K K个聚类中心(cluster centroid) μ1,μ2,…,μK μ1,μ2,…,μK
- Cluster Assignment: 对于每个数据点 x(i) x(i),寻找离它最近的聚类中心,将其归入该类;即 c(i)=mink||x(i)−μk||2 c(i)=mink||x(i)−μk||2,其中 c(i) c(i)表示 x(i) x(i)所在的类
- Move Centroid: 更新聚类中心 uk uk的值为所有属于类 k k的数据点的平均值
- 重复2、3步直到收敛或者达到最大迭代次数
Grid Loss及其在人脸检测中的应用
http://geek.csdn.net/news/detail/127543