RFM的用户价值划分
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
data = pd.read_excel('..//数据/PYTHON-RFM实战数据.xlsx')
data
品牌名称 | 买家昵称 | 付款日期 | 订单状态 | 实付金额 | 邮费 | 省份 | 城市 | 购买数量 | |
---|---|---|---|---|---|---|---|---|---|
0 | 数据不吹牛 | 叫我李2 | 2019-01-01 00:17:59.000 | 交易成功 | 186 | 6 | 上海 | 上海市 | 1 |
1 | 数据不吹牛 | 0cyb1992 | 2019-01-01 00:59:54.000 | 交易成功 | 145 | 0 | 广东省 | 广州市 | 1 |
2 | 数据不吹牛 | 萝污萌莉 | 2019-01-01 07:48:48.000 | 交易成功 | 194 | 8 | 山东省 | 东营市 | 1 |
3 | 数据不吹牛 | atblovemyy | 2019-01-01 09:15:49.000 | 付款以后用户退款成功,交易自动关闭 | 84 | 0 | 江苏省 | 镇江市 | 1 |
4 | 数据不吹牛 | 小星期鱼 | 2019-01-01 09:59:33.000 | 付款以后用户退款成功,交易自动关闭 | 74 | 0 | 上海 | 上海市 | 1 |
... | ... | ... | ... | ... | ... | ... | ... | ... | ... |
28828 | 数据不吹牛 | nhuliy5 | 2019-06-30 22:22:09.000 | 交易成功 | 144 | 0 | 湖南省 | 长沙市 | 1 |
28829 | 数据不吹牛 | 2ganlin7 | 2019-06-30 22:33:42.773 | 交易成功 | 216 | 0 | 安徽省 | 滁州市 | 1 |
28830 | 数据不吹牛 | 点大a | 2019-06-30 22:36:52.890 | 交易成功 | 231 | 0 | 湖北省 | 武汉市 | 1 |
28831 | 数据不吹牛 | 8陈爷558989 | 2019-06-30 22:44:38.392 | 交易成功 | 99 | 0 | 广东省 | 深圳市 | 2 |
28832 | 数据不吹牛 | gxienue_ya | 2019-06-30 22:46:22.511 | 交易成功 | 301 | 0 | 陕西省 | 西安市 | 7 |
28833 rows × 9 columns
data1 = data[data['订单状态']=='交易成功']
data1
品牌名称 | 买家昵称 | 付款日期 | 订单状态 | 实付金额 | 邮费 | 省份 | 城市 | 购买数量 | |
---|---|---|---|---|---|---|---|---|---|
0 | 数据不吹牛 | 叫我李2 | 2019-01-01 00:17:59.000 | 交易成功 | 186 | 6 | 上海 | 上海市 | 1 |
1 | 数据不吹牛 | 0cyb1992 | 2019-01-01 00:59:54.000 | 交易成功 | 145 | 0 | 广东省 | 广州市 | 1 |
2 | 数据不吹牛 | 萝污萌莉 | 2019-01-01 07:48:48.000 | 交易成功 | 194 | 8 | 山东省 | 东营市 | 1 |
5 | 数据不吹牛 | 重碎叠 | 2019-01-01 10:00:07.000 | 交易成功 | 197 | 0 | 江苏省 | 南京市 | 1 |
6 | 数据不吹牛 | iho_jann | 2019-01-01 10:00:08.000 | 交易成功 | 168 | 0 | 广东省 | 广州市 | 1 |
... | ... | ... | ... | ... | ... | ... | ... | ... | ... |
28828 | 数据不吹牛 | nhuliy5 | 2019-06-30 22:22:09.000 | 交易成功 | 144 | 0 | 湖南省 | 长沙市 | 1 |
28829 | 数据不吹牛 | 2ganlin7 | 2019-06-30 22:33:42.773 | 交易成功 | 216 | 0 | 安徽省 | 滁州市 | 1 |
28830 | 数据不吹牛 | 点大a | 2019-06-30 22:36:52.890 | 交易成功 | 231 | 0 | 湖北省 | 武汉市 | 1 |
28831 | 数据不吹牛 | 8陈爷558989 | 2019-06-30 22:44:38.392 | 交易成功 | 99 | 0 | 广东省 | 深圳市 | 2 |
28832 | 数据不吹牛 | gxienue_ya | 2019-06-30 22:46:22.511 | 交易成功 | 301 | 0 | 陕西省 | 西安市 | 7 |
27793 rows × 9 columns
data_M = data1[['买家昵称','实付金额']]
data_M
买家昵称 | 实付金额 | |
---|---|---|
0 | 叫我李2 | 186 |
1 | 0cyb1992 | 145 |
2 | 萝污萌莉 | 194 |
5 | 重碎叠 | 197 |
6 | iho_jann | 168 |
... | ... | ... |
28828 | nhuliy5 | 144 |
28829 | 2ganlin7 | 216 |
28830 | 点大a | 231 |
28831 | 8陈爷558989 | 99 |
28832 | gxienue_ya | 301 |
27793 rows × 2 columns
M = pd.DataFrame(data_M.groupby('买家昵称')['实付金额'].sum())
M