聚类分析
-
方法:BIRCH
-
数据来源:https://archive.ics.uci.edu/ml/index.php
或者:https://gitee.com/guet_seven_data-department/python_crawler_small/wikis/glass.csv?sort_id=2963383 -
数据集说明:数据集包含9个特征变量,分别为ri,na,mg,al,si,k,ca,ba,fe;1个类别变量glass_type,共有214个样本,
-
代码实现
from sklearn.cluster import Birch #BIRCH模块导入 import pandas as pd import matplotlib.pyplot as plt glass=pd.read_csv('G:/机器学习/书籍阅读/python爬虫/glass.csv') #数据导入,需要更改一下路径 #glass=pd.read_csv(r'G:\机器学习\书籍阅读\python爬虫\glass.csv') clf=Birch(n_clusters=4) #n_clusters:设置聚类数为n clf.fit(glass) #函数训练模型 pre=clf.predict(glass) #所属类别预测,分为4类,(0,1,2,3)
PCA降维实现
-
PCA(Principal Component Analysis)即主成分分析
-
代码实现
#降维 from sklearn.decomposition import PCA from mpl_toolkits.mplot3d import Axes3D #三维绘图 pca=PCA(n_components=3) #降维到3维 newDate=pca.fit_transform(glass) x1=newDate[:,0] x2=newDate[:,1] x3=newDate[:,2] fig=plt.figure() ax=Axes3D(fig) ax.scatter(x1,x2,x3,c=pre)
-
聚类数为3的可视化情况
-
聚类数为4的可视化情况