数据分析渣一枚,SQL语言写6了,python还在不断进阶阶段,结合已有的数据源+两年前看的一点python基础+网上参考的无数实例,试写一个K-means的聚类分析,请各位大神们疯狂鞭挞,各位小白们互相学习进步吖>o" />
选取2019年第四季度某产品用户数据,开始具体编写:
导入模块
#导入数据分析大家庭
import pandas as pd
import numpy as np
from sklearn.cluster import KMeans #聚类模块
import matplotlib.pyplot as plt #画图模块
from matplotlib.font_manager import FontProperties #字体模块
font = FontProperties(fname=r"C:\Windows\Fonts\simhei.ttf", size=14) #先在网上下载simhei.ttf,放到Windows文件夹的Fonts文件夹里
导入数据
#打开excel文件,header=None为列添加编号
data1 = pd.read_excel(r"D:\python实战\第四季度用户产品明细-聚类.xlsx",header=None)
#插入列名
data1.columns=['store_id','course_id','course_type','course','start_time','user_id','birthday