Python机器学习应用-北京理工大学
无监督学习和有监督学习的最大区别在于有无标签。
无监督学习最多应用于聚类和降维。
根据距离进行聚类:
欧氏距离、
曼哈顿距离(一个路口到另一个路口)、
马氏距离(样本点标准化,再计算样本点间)d(xi,yi) = [(xi - xj)^T*s^(-1)*(xi - xj)]^(1/2)
余弦相似度
Sklearn(Scikit-learn) 聚类往往在sklearn.cluster这个模块中。DBSCAN
将高维数据转化为低维数据,保证数据所代表的特性。
sklearn有7种降维方法,可视为对组成成分的分解