这里,使用scikit-learn模块中的聚类算法包KMeans, 仅支持欧几里得距离,默认初始点采用随机选取,也可使用k-means++(聚类中心点之间相距很远)方式选取初始点, 支持并发聚类.
在UCI下载小型数据集 Data_User_Modeling_Dataset_Hamdi Tolga KAHRAMAN,生成聚类模型并测试,绘制聚类结果散点图.聚类结果评估.
import pandas as pd
from sklearn.cluster import KMeans
import numpy as np
import matplotlib.pyplot as plt
#----------------绘制聚类后的概率图------------------
def density_plot(data,res):
plt.figure()
j=