http://blog.csdn.net/wangxin110000/article/details/22529629
所有的聚类问题,都可以简化成
1:找聚类中心的问题;
2:距离表示的问题,不同的聚类要求需要有不一样的距离定义;
3:数据表示的问题,比如数据降维,特征选择等等。
而所有的分类问题
1:寻找最优判断准则的问题;
2:数据最优表示的问题,比如低维没法分,可以放到高维度上去考虑,比如核方法,又或者像LDA那样,找个新空间,让数据的类内距离变小,类间距变大。这样的方法还有很多,比如流型学习那样,都是换个表示方法,或者换个距离测度让数据达到更容易分开的目的。