机器学习-KMeans(3D散点图绘制)

读取“客户价值.xlsx”,使用Axes3D绘制反映RFM数据列关系的3D散点图。

import pandas as pd

import numpy as np

from sklearn.cluster import KMeans

df = pd.read_excel('某超市的销售数据.xlsx')

df = df.dropna() # 删除缺失值

df1 = df[['顾客编号', '销售金额', '销售日期','数据采集时间']]

df1['R']=(pd.to_datetime(df1['数据采集时间'])-pd.to_datetime(df1['销售日期'])).values/np.timedelta64(1,'D')

df1=df1[['顾客编号', '销售金额', '销售日期','R']]

df2=df1.groupby('顾客编号').agg({'R':'min','销售金额':'mean'})

df2['F']=df1.groupby(['顾客编号'])['顾客编号'].size()

df2.to_excel('data.xlsx',index=False)

 

datafile=r'data.xlsx'

transformfile=r'tfdata.xls'

data=pd.read_excel(datafile)

data=data[["R",'F','销售金额']]

data=(data-data.mean(axis=0))/(data.std(axis=0))

data.columns=['R','F','M']

data.to_excel(transformfile,index=False)

 

inputfile=r'tfdata.xls'

data = pd.read_excel(inputfile)

iteration=500

kmodel = KMeans(n_clusters = 4,max_iter=iteration)

kmodel.fit(data) # 训练模型

rl=pd.Series(kmodel.labels_).value_counts()

r2=pd.DataFrame(kmodel.cluster_centers_)

r=pd.concat([r2,rl],axis=1)

r.columns=list(data.columns)+[u'聚类数量']

r3 =pd.Series(kmodel.labels_,index=data.index)

r=pd.concat([data,r3],axis=1)

r.columns=list(data.columns)+[u'聚类类别']

r.to_excel('客户价值1.xlsx')

kmodel.cluster_centers_

kmodel.labels_

 

from mpl_toolkits.mplot3d import Axes3D

import matplotlib.pyplot as plt

import matplotlib

matplotlib.rcParams['font.sans-serif']=['SimHei']

matplotlib.rcParams['axes.unicode_minus']=False

fig=plt.figure()

ax=Axes3D(fig)

ax.scatter(r['R'],r['F'],r['M'])

ax.set_xlabel('消费间隔')

ax.set_ylabel('消费频率')

ax.set_zlabel('消费金额')

plt.show

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
好的,关于Python 3D以及Kmeans机器学习3D Matplotlib绘,我可以提供一些基本的信息,希望对你有所帮助。 Python中的Matplotlib库是一个数据可视化工具,可以绘制出各种类型的表,包括2D和3D表。在进行3D时,需要引入Matplotlib库中的mplot3d子库。 K-means算法是一种聚类算法,可以将一组数据分为多个类别,每个类别中的数据具有相似的特征。K-means算法的核心思想是通过计算数据之间的距离,将数据划分到最近的簇中,并不断调整簇的中心点,直到达到最优的聚类效果。 在Python中,可以使用sklearn库中的KMeans类来实现K-means算法。在实现3D时,可以使用Matplotlib库中的mplot3d子库中的Axes3D类来创建3D坐标轴,并使用scatter3D函数绘制散点图。 具体的代码实现可以参考以下示例: ```python import numpy as np import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import Axes3D from sklearn.cluster import KMeans # 生成随机数据 np.random.seed(5) data = np.random.normal(size=[100, 3]) # 使用K-means算法进行聚类 kmeans = KMeans(n_clusters=3).fit(data) labels = kmeans.labels_ # 绘制3D散点图 fig = plt.figure() ax = fig.add_subplot(111, projection='3d') ax.scatter3D(data[:, 0], data[:, 1], data[:, 2], c=labels) plt.show() ``` 这段代码可以生成100个随机数据,然后使用K-means算法将其分为3类,并绘制3D散点图。你可以根据自己的需要修改数据和参数,实现不同类型的3D表和K-means聚类效果的可视化展示。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值