#-*- coding: utf-8 -*-
import pandas as pd
from sklearn.cluster import KMeans
# 参数初始化
inputfile = r'E:\Downloads\1662557648_Lbbweibo\python数据分析与挖掘实战配套资料' \
r'\图书配套数据、代码\chapter5\demo\data\consumption_data.xls'
outputfile = r'E:\Downloads\1662557648_Lbbweibo\python数据分析与挖掘实战配套资料' \
r'\图书配套数据、代码\chapter5\demo\tmp\data_type.xls'
k = 3 # 聚类的类别
iteration = 500 # 聚类最大循环次数
data = pd.read_excel(inputfile, index_col='Id')
data_zs = (data - data.mean()) / data.std() # 数据标准化
model = KMeans(n_clusters=k, max_iter=iteration) # 分为k类,并发数为4
model.fit(data_zs) # 开始聚类
# 简单打印结果
r1 = pd.Series(model.labels_).value_counts() # 统计各个类别的数目
r2 = pd.DataFrame(model.cluster_centers_) # 找出聚类中心
r = pd.concat([r2, r1], axis=1) # 横向连接(axis=0纵向连接),得到聚类中心对应的类别下的数目 连接 r1 和 r2
r.columns = list(data.columns) + [u'
matplotlib绘图顺序命名多个中文标题无法显示
最新推荐文章于 2024-08-07 11:26:46 发布
在使用matplotlib绘制图表时,遇到给多个中文标题命名出现乱码的问题。图片显示了错误的结果。
摘要由CSDN通过智能技术生成