小红书消费数据分析

数据集介绍
数据来源:https://www.kesci.com/mw/dataset/5f1e3fde94d484002d2f6715
数据说明:这是一个关于用户在小红书购买金额的数据集, 共有29452条数据, 7个变量
Revenue:用户下单的购买金额
3rd_party_stores 用户过往在app中从第三方购买的数量,为0则代表只在自营商品中购买
Gender 性别 1:男 0:女 未知则空缺
Engaged_last_30 最近30天在app上有参与重点活动(讨论,卖家秀)
Lifecycle 生命周期分为A,B,C (分别对应注册6个月内,1年内,2年内)
days_since_last_order 最近一次下单距今的天数 (小于1则代表当天有下单)
数据分析步骤
明确目的
提出问题
数据整理
数据可视化分析
建立数据模型
分析目的: 假设用户购买金额(revenue)为因变量, 其它六个变量为自变量, 探寻不同特征的人群对总购买金额的贡献大小, 帮助企业定位消费人群并在营销推广等方面做出更好决策。 综合所有变量建立多线性数据模型并分析数据模型的准确性。 准确的数据模型能够帮助预测用户下单金额。previous_order_amount 以往累积的用户购买金额

小红书是当前著名的电商平台, 包含小红书社区与消费窗口。 小红书的独特性在于口碑营销与正品自营, 用社区交流和与许多海外品牌建立战略合作关系来吸引用户。 作为商家投放广告与销售商品的重要阵地, 小红书会吸引什么类型的人群?在这些用户中, 哪些消费群体更庞大, 哪些消费群体的平均购买力更高?

分析工具:python
提出问题:哪些消费群体更庞大,平均购买力更强?已知自变量能否准确预测用户购买金额?数据整理:

https://www.kesci.com/mw/dataset/5f1e3fde94d484002d2f6715

import pandas as pd
import numpy as np
import random
from matplotlib import pyplot as plt
from pyecharts.charts import Boxplot
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_boston

###数据导入
df=pd.read_csv("/Users/ruohezhou/Downloads/datamodelwhale/redbook.csv")
df.head(10)
在这里插入图片描述
###去除重复数值和缺失数值
df.drop_duplicates(inplace=True)
df.reset_index(drop=True,inplace=True)
df.repla

  • 3
    点赞
  • 39
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值