电商用户价值分析——基于RFM模型、KMeans聚类

本文通过RFM模型和KMeans聚类对电商用户进行价值分析,揭示用户行为模式。利用Python进行数据处理和分析,得出用户主要集中在18-30岁,消费用户集中于广东、上海、北京。KMeans聚类结果表明,用户可分为三类,重点在于一般挽留客户和重要客户群体。建议针对用户年龄和地区制定运营策略。
摘要由CSDN通过智能技术生成

一、背景

通过对用户价值进行分层,并针对不同用户制定不同运营策略以达到用户精准营销的策略。

二、RFM模型、KMeans聚类

美国数据库营销研究所Arthur Hughes的研究发现,在客户数据分析中发现了三个重要的指标,即:最近一次消费(Recency近度)、消费频率(Frequency频度)、消费金额(Monetary额度),它们是衡量客户价值的重要标准。RFM分析是一种探索性分析方法。

k-means简介

1.聚类算法(clustering Algorithms)介绍
聚类是一种无监督学习—对大量未知标注的数据集,按数据的内在相似性将数据集划分为多个类别,使类别内的数据相似度较大而类别间的数据相似度较小。
2.k-means原理详解
k-means是一种常见的聚类算法,也叫k均值或k平均。通过迭代的方式,每次迭代都将数据集中的各个点划分到距离它最近的簇内,这里的距离即数据点到簇中心的距离。

三、分析框架

在这里插入图片描述

四、具体分析

1. 导入所需的库

import pandas as pd
import numpy as np
import datetime
import matplotlib.pyplot as plt
import cufflinks as cf
cf.set_config_file(offline=True) # 离线模式绘图

2. 导入数据

data = pd.read_csv(r"D:\Desktop\python code\python数据分析\用户分群KMeans+RFM\产品销售分析.csv")
data.head()

在这里插入图片描述

3. 数据清洗

缺失值处理

# 查看数据缺失
data.isnull().sum()

在这里插入图片描述

缺失值字段均为非核心字段,后续分析可直接提取有效字段。

重复值处理

#查看重复值
data.duplicated().sum()

0

异常值处理

#查找付款金额小于0的数据
abnormal=data[np.where(data['支付金额'] < 0,True,False)]
abnormal

在这里插入图片描述

4. 数据分析

4.1 核心数据分析

  • 总GMV
#总GMV
GMV=round(data['支付金额'].sum(),ndigits=2)

4154205.04

  • 每月GMV
#每月GMV
GMV_M=data.groupby(by='event_month',as_index=True).agg({
   '支付金额':sum}).iplot(kind='line')

在这里插入图片描述

4月销售数据较大提升,可能是促销活动导致;
整体上销售数据趋势有所上升,但持续性无法得到保证

  • 客单价
#客单价
price_uv=round(data['支付金额'].sum() / data['user_id'].nunique(),0)

88.59

  • 笔单价
#笔单价
price_pv=round(data['支付金额'].sum() / data['order_id'].nunique(),0)

45.56

4.2 用户分析

年龄

# 先划分一下年龄
data['age_cut'] = pd.cut(data['age'],bins=[data.age.min(),20,30,40,data.age.max()],labels=['16-20'
  • 14
    点赞
  • 145
    收藏
    觉得还不错? 一键收藏
  • 17
    评论
根据引用\[1\]和\[2\]的内容,RFM模型是一种用于分析客户价值模型,它使用了一些直接相关的变量来描述用户特征。然而,这些变量并不能完全涵盖用户特征,因此可以使用K-Means聚类算法引入其他变量来进一步分析不同类别客户的特征。在K-Means聚类分析中,首先选取了一些重要的指标来刻画用户,然后对这些指标进行了数据标准化,接着使用K-Means算法进行聚类,得到了每个分类的质心。最后,根据质心和用户特征,可以得到用户画像表,用于描述不同类别客户的特征。\[2\] 根据引用\[3\]的内容,为了确定K-Means聚类的簇数,可以使用肘方法。在肘方法中,选择斜率开始缓慢下降的点作为簇数。在这个例子中,选择了3作为K-Means的簇数。然后,使用K-Means算法进行聚类,并计算每个簇下的R、F、M值的平均值。\[3\] 综上所述,通过RFM模型K-Means聚类分析,可以对客户进行细分,并了解不同类别客户的特征。 #### 引用[.reference_title] - *1* *2* [K-Means聚类分析--RFM模型](https://blog.csdn.net/lau143/article/details/112604862)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [基于产品的RFM模型k-means聚类分析](https://blog.csdn.net/foxirensheng/article/details/122704512)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 17
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值