项目一 B站会员购订单数据分析
1、bilibili会员购平台业务背景介绍
- 业务内容:B站自己的商业化业务板块,主要包括**商品(手办、周边)和票务(漫展、赛事)**两大类
- 业务逻辑:存在很多IP→IP衍生品→形成产业链(围绕IP做商品、展览,做推广、销售)和服务(ACG文化基础、更高的信息触达率、更高的用户信任度、经济规模优势)两个业务→给用户更多的价值感,提升作品影响力
- 用户画像:与B站几乎一致,年轻人、男性、一二线城市
- 内容标签:搞笑、日常、bilibili正版、电子竞技
2、平台相关数据介绍
商品编号(SKU)、商品名称、商品价格、票号(票务)、座位(票务)、联系地址、渠道(从哪个渠道下单买的,主页/搜索/测试渠道/广告/购物车/分类栏)、下单时间、支付时间、支付单号、店铺名称、店铺id、订单状态(待支付/已取消/待发货/售后状态/是否海外购/税费)
3、订单数据的数据分析方法
(1)订单数据的数据分析思路
①数据抓取(数据库数据调取)
②数据清洗(无效数据清洗、有效数据筛选)
③数据分析(用户属性判别、品牌渗透判别、订单时间/地区分布……)
(2)相关python知识点讲解
通常使用pandas包处理分析。
①数据读取(单个表格、多个表格读取)
# 单表格读取
data = pd.read_excel('.xlsx')
data.head()
# 多表格读取
file_path = '数据路径'
file_list = os.listdir(file_path)
for orders in file_list:
data = pd.read_excel(file_path + '\\' + orders
data.head()
②数据处理(数据格式转换、数据清洗)
订单地区数据筛选,剔除“–”无效数据
data = dt[dt['联系地址']!='--']
data.rename(columns={'商品价格':'price','联系地址':'address}) #……
③数据分析(描述性分析、预测性分析、可视化分析)
# 描述性分析
df.describe() # 各统计数值
df.hist(bins=20) # 直方图
(3)b站会员购订单数据的宏观分类与分析思路
①订单类型:
待支付(已经提交订单信息等待支付的订单)、已取消(被取消的订单,主动取消/支付超时被动取消)、待发货(已付款等待发货的订单)、待收货(已发货等待收货的订单)、已完成(完成所有订单环节的订单ÿ