Kaggle超市客户分类-KMeans无监督案例

KMeans无监督案例:Kaggle超市客户分类

案例背景

现有超市购物中心客户的一些基本数据,如客户ID,年龄,性别,年收入和消费分数。消费分数是根据客户行为和购买数据等条件分配给客户的分数。
需要解决问题:利用现有资料,划分不同客户类型,以便可以了解哪些客户为超市优质客户,并向营销团队提供意见。
案例资料:链接:https://pan.baidu.com/s/1w04nEWJUgjgxulj3VixE2A 提取码:sfp3

项目

1.模块导入和数据读取

#导入对应的模块
import pandas as pd
import matplotlib
from matplotlib import pyplot as plt
from sklearn.cluster import KMeans

#设置全部列显示和浮点数格式
pd.options.display.max_columns=None
pd.set_option('display.float_format',lambda x:'%.6f'%x)

#数据读取
df=pd.read_csv(open(r"C:\Users\angella.li\Desktop\案例\customer-segmentation-tutorial-in-python\Mall_Customers.csv"),encoding='utf-8',index_col=0)
#为了方便分析数据,需要重新定义列名
df=df.rename(columns={
   'Gender':'gender','Age':'age','Annual Income (k$)':'annual_income','Spending Score (1-100)':'spending_score'})
df.gender.replace(['Male','Female'],[1,0],inplace=True)#用数字表示性别
df.head(2)

数据读取结果
在这里插入图片描述

2.数据处理

#对缺失值处理
df.isnull().sum()

在这里插入图片描述
数据无缺失值。

3. 数据划分

第一步将数据标准化。

#计算出数据的均值和标准差
dfms=pd.concat([df.mean().to_frame(),df.std().
  • 6
    点赞
  • 52
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值