机器学习-KMeans

最新推荐文章于 2024-06-06 10:35:09 发布

nameless2003

最新推荐文章于 2024-06-06 10:35:09 发布

阅读量80

点赞数

文章标签： python kmeans

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/nameless2003/article/details/131389079

版权

分析“某超市的销售数据.xlsx”数据集当中的客户价值，将客户分为“一般发展客户”、“一般保持客户”、“重要挽留客户”、“重要保持客户”4类，并保存为新的数据表文件“客户价值.xlsx”。

import pandas as pd

import numpy as np

from sklearn.cluster import KMeans

df = pd.read_excel('某超市的销售数据.xlsx')

df = df.dropna() # 删除缺失值

df1 = df[['顾客编号', '销售金额', '销售日期','数据采集时间']]

df1['R']=(pd.to_datetime(df1['数据采集时间'])-pd.to_datetime(df1['销售日期'])).values/np.timedelta64(1,'D')

df1=df1[['顾客编号', '销售金额', '销售日期','R']]

df2=df1.groupby('顾客编号').agg({'R':'min','销售金额':'mean'})

df2['F']=df1.groupby(['顾客编号'])['顾客编号'].size()

df2.to_excel('data.xlsx',index=False)

datafile=r'data.xlsx'

transformfile=r'tfdata.xls'

data=pd.read_excel(datafile)

data=data[["R",'F','销售金额']]

data=(data-data.mean(axis=0))/(data.std(axis=0))

data.columns=['R','F','M']

data.to_excel(transformfile,index=False)

inputfile=r'tfdata.xls'

data = pd.read_excel(inputfile)

iteration=500

kmodel = KMeans(n_clusters = 4,max_iter=iteration)

kmodel.fit(data) # 训练模型

rl=pd.Series(kmodel.labels_).value_counts()

r2=pd.DataFrame(kmodel.cluster_centers_)

r=pd.concat([r2,rl],axis=1)

r.columns=list(data.columns)+[u'聚类数量']

r3 = pd.Series(kmodel.labels_,index=data.index)

r=pd.concat([data,r3],axis=1)

r.columns=list(data.columns)+[u'聚类类别']

r.to_excel('客户价值1.xlsx')

kmodel.cluster_centers_

kmodel.labels_

'''X = df[['顾客编号', '销售金额', '销售日期','数据采集时间']].values

kmeans = KMeans(n_clusters=4, random_state=0).fit(X)

labels = kmeans.labels_

df['客户价值']=labels

df.to_excel('客户价值2.xlsx', index=False)'''

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

nameless2003 CSDN认证博客专家 CSDN认证企业博客

码龄3年

10: 原创

142万+: 周排名

62万+: 总排名

2834: 访问

: 等级

101: 积分

1: 粉丝

1: 获赞

12: 评论

3: 收藏

私信

关注

热门文章

最新评论

Numpy数组运算
CSDN-Ada助手: 非常棒的博文！你对Numpy数组的运算有很好的理解。继续保持创作，你会取得更大的进步的！除了你提到的Numpy数组运算，还有一些与之相关的扩展知识和技能可以进一步学习。其中包括： 1. 广播（Broadcasting）：Numpy的广播功能可以使得不同形状的数组进行运算，这样可以简化很多代码。 2. 数组切片（Array Slicing）：通过切片，你可以选择数组中的部分元素进行操作，可以提高代码的灵活性。 3. 数组形状操作（Array Shape Manipulation）：Numpy提供了许多函数，如reshape、resize和transpose等，可以方便地改变数组的形状。 4. 线性代数（Linear Algebra）：Numpy还提供了丰富的线性代数函数，如矩阵乘法、矩阵求逆等，可以进行更复杂的数学运算。希望这些扩展知识和技能对你有所帮助。继续努力学习，期待你的下一篇博文！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
Numpy数组连接
CSDN-Ada助手: 恭喜你写了第三篇博客！标题“Numpy数组连接”听起来很有趣。你的博客内容一定对Numpy数组的连接有深入的探讨和实践。继续保持创作的热情，你的博客必将成为学习Numpy的好去处。接下来，我建议你可以考虑探索更多Numpy的高级特性或者深入研究其他与数据处理相关的主题。谦虚地说，你的博客已经为读者提供了很多有价值的内容，所以继续扩展你的知识领域将会给读者带来更多惊喜。期待你下一篇博客的发布！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
机器学习-KMeans
CSDN-Ada助手: 恭喜你写了第四篇博客！标题“机器学习-KMeans”听起来非常有趣。你的努力和持续创作让人印象深刻。在接下来的创作中，或许你可以考虑探索一些与KMeans相关的实际案例或应用，这样能够更好地帮助读者理解和应用这个算法。期待你在未来的博客中分享更多有趣的内容。加油！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
机器学习-KMeans（3D散点图绘制）
CSDN-Ada助手: 恭喜您写下了第5篇博客！标题中的KMeans算法和3D散点图绘制一定是非常有趣的内容。从您的博客中可以看出您对机器学习的研究和探索颇有心得。不过，我想提出一个小小的建议，下一步您可以尝试结合KMeans算法和其他数据可视化方法，进一步探索数据之间的关系和规律。期待您未来更多精彩的创作！
机器学习-LinearRegression
CSDN-Ada助手: 恭喜您写了第6篇博客！标题“机器学习-LinearRegression”听起来非常有趣。您的持续创作让我感到非常振奋。在下一篇博客中，我建议您可以探索一下线性回归算法在实际应用中的一些挑战和解决方案。这样的话，读者们将能够更深入地了解线性回归算法的局限性，并从实践角度进行更全面的学习。期待您的下一篇博客！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。