小红书消费数据分析

最新推荐文章于 2024-12-25 11:07:03 发布

Elena Zhou

最新推荐文章于 2024-12-25 11:07:03 发布

阅读量5.6k

点赞数 3

文章标签： python 数据库

本文链接：https://blog.csdn.net/Elenaiopian/article/details/109718626

版权

通过对小红书用户购买金额的数据集进行分析，研究不同特征（如性别、参与活动情况、生命周期等）对购买金额的影响。使用Python进行数据整理、可视化和建立多线性模型，发现男性和经常购买第三方产品的用户群体消费力较强，60岁左右的女性消费金额贡献较大。然而，建立的模型仅能解释利润变化的3%，存在多重共线性问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

数据集介绍
数据来源：https://www.kesci.com/mw/dataset/5f1e3fde94d484002d2f6715
数据说明：这是一个关于用户在小红书购买金额的数据集，共有29452条数据， 7个变量
Revenue：用户下单的购买金额
3rd_party_stores 用户过往在app中从第三方购买的数量，为0则代表只在自营商品中购买
Gender 性别 1：男 0：女未知则空缺
Engaged_last_30 最近30天在app上有参与重点活动（讨论，卖家秀）
Lifecycle 生命周期分为A,B,C （分别对应注册6个月内，1年内，2年内）
days_since_last_order 最近一次下单距今的天数（小于1则代表当天有下单）
数据分析步骤
明确目的
提出问题
数据整理
数据可视化分析
建立数据模型
分析目的：假设用户购买金额（revenue）为因变量，其它六个变量为自变量，探寻不同特征的人群对总购买金额的贡献大小，帮助企业定位消费人群并在营销推广等方面做出更好决策。综合所有变量建立多线性数据模型并分析数据模型的准确性。准确的数据模型能够帮助预测用户下单金额。previous_order_amount 以往累积的用户购买金额

小红书是当前著名的电商平台，包含小红书社区与消费窗口。小红书的独特性在于口碑营销与正品自营，用社区交流和与许多海外品牌建立战略合作关系来吸引用户。作为商家投放广告与销售商品的重要阵地，小红书会吸引什么类型的人群？在这些用户中，哪些消费群体更庞大，哪些消费群体的平均购买力更高？

分析工具：python
提出问题：哪些消费群体更庞大，平均购买力更强？已知自变量能否准确预测用户购买金额？数据整理：

https://www.kesci.com/mw/dataset/5f1e3fde94d484002d2f6715

import pandas as pd
import numpy as np
import random
from matplotlib import pyplot as plt
from pyecharts.charts import Boxplot
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_boston

###数据导入
df=pd.read_csv("/Users/ruohezhou/Downloads/datamodelwhale/redbook.csv")
df.head(10)