《十周成为数据分析师》笔记——业务线 第四节 电商平台订单报表分析

十周成为数据分析师 专栏收录该内容
9 篇文章 4 订阅

1、bilibili会员购平台业务背景介绍

  • 业务内容:B站自己的商业化业务板块,主要包括**商品(手办、周边)票务(漫展、赛事)**两大类
  • 业务逻辑:存在很多IP→IP衍生品→形成产业链(围绕IP做商品、展览,做推广、销售)和服务(ACG文化基础、更高的信息触达率、更高的用户信任度、经济规模优势)两个业务→给用户更多的价值感,提升作品影响力
  • 用户画像:与B站几乎一致,年轻人、男性、一二线城市
  • 内容标签:搞笑、日常、bilibili正版、电子竞技

2、平台相关数据介绍

商品编号(SKU)、商品名称、商品价格、票号(票务)、座位(票务)、联系地址、渠道(从哪个渠道下单买的,主页/搜索/测试渠道/广告/购物车/分类栏)、下单时间、支付时间、支付单号、店铺名称、店铺id、订单状态(待支付/已取消/待发货/售后状态/是否海外购/税费)

3、订单数据的数据分析方法

(1)订单数据的数据分析思路

①数据抓取(数据库数据调取)
②数据清洗(无效数据清洗、有效数据筛选)
③数据分析(用户属性判别、品牌渗透判别、订单时间/地区分布……)

(2)相关python知识点讲解

通常使用pandas包处理分析。
①数据读取(单个表格、多个表格读取)

 # 单表格读取
data = pd.read_excel('.xlsx')
data.head()
# 多表格读取
file_path = '数据路径'
file_list = os.listdir(file_path)
for orders in file_list:
    data = pd.read_excel(file_path + '\\' + orders
    data.head()

②数据处理(数据格式转换、数据清洗)
订单地区数据筛选,剔除“–”无效数据

data = dt[dt['联系地址']!='--']
data.rename(columns={'商品价格':'price','联系地址':'address})  #……

③数据分析(描述性分析、预测性分析、可视化分析)

# 描述性分析
df.describe()  # 各统计数值
df.hist(bins=20) # 直方图

(3)b站会员购订单数据的宏观分类与分析思路

①订单类型:
待支付(已经提交订单信息等待支付的订单)、已取消(被取消的订单,主动取消/支付超时被动取消)、待发货(已付款等待发货的订单)、待收货(已发货等待收货的订单)、已完成(完成所有订单环节的订单)
② 对取消订单针对性分析

  • 恶意订单占货分析(提交订单不付款,占库存)
    excel操作:
    巨额取消订单筛选,判断是否为恶意压货订单
    a. 筛选,订单状态,选择已取消,得到所有已取消的订单。
    b. 将商品价格降序,看是否有高价订单,注意联系地址的重复性、空地址(案例数据结果:有些订单金额特别高(其中很多没有地址),属于恶意订单,较低金额的属于比较正常的,但多个订单同一地址的也需要关注)
    c. 根据商品编号,找到订单具体数据,找到用户id,看这个用户过去的购买记录,如果经常存在敏感操作→封禁此账号
  • 剔除取消订单以确保订单数据(支付时间)的正确性(为后续的时间分布分析等服务)

(4)b站会员购订单数据的微观分类与分析思路

——订单量、订单额、客单价的统计分析(结合不同订单数据类型结合分析目的进行分析)

  • 按年、季度进行订单统计→分析行业/市场需求波动(淡季、旺季)
  • 按月进行订单统计→公司/部门业绩分析(根据不同阶段的业绩,提供对应优惠,促进购买)
  • 按小时进行订单统计→消费者/用户消费习惯分析
  • 按分钟/秒进行订单统计→促销/活动即时效果分析
    ① 订单时间分布分析
    有效下单时间筛选→小时+分钟数据筛选→小时+分钟订单统计
    excel操作:
    a. 全选下单时间,右键设置单元格格式,选择时间类型为全中文
    b. 选择下单时间列,插入数据透视表,确定,下单时间依次拖到行,值(计数项)
    c. 透视表中的数据,选择数据,插入柱状图,可加入数据标签(小时订单数统计)
    结果:晚8点为高峰期,凌晨1点-9点为低谷期,意外:晚10-12点属于高峰期
    d. 插入帕累托图
    80%的订单数来自于下午和深夜
    e. 插入订单量折线图,增加趋势线
    从0点到23点,订单量暴涨
    ② 订单价格分布分析
    按小时维度价格统计→按小时维度总订单额统计→按小时维度客单价统计

订单量分布、客单价分布
客单价变化、客单价交叉分析
excel操作:
a. 选中商品价格至下单时间列,插入数据透视表
b. 下单时间拖到行,将商品价格拖到值。插入柱状图,中午和下午两点、晚七点订单额较高
c. 将透视表的值调整为平均值。(设置数字格式保留1位小数)插入柱状图/折线图,增加数据标签
分析:客单价在凌晨4点、中午12点、中午、晚上10点11点高位,整体趋势逐步提升
③ 订单时间分布与价格分布的交叉分析
a. 订单量和订单额交叉分析
订单额:晚8点订单量最高,但订单额并不是最高,实际上晚8点订单额偏低
b. 订单量和客单价交叉分析
晚上8点:客单价低,订单量高
中午12点、晚上10点和晚上11点:客单价高、订单量高
c. 建议:
i. 晚上8点,消费人群主要是购买力不高的价格敏感性消费人群,可以发放一些优惠券或者开展促销活动;
ii. 晚上9点到晚上12点,增加广告的曝光量

——商品相关分析思路

①商品单维度分析
——分析不同商品的客单价分布

excel操作:
a. 商品编号+商品价格,插入数据透视表,商品编号拉到行,商品价格拉到值(求和项→平均值)。设置商品价格显示没有小数,按客单价降序排列
c. 选择客单价,插入柱状图(直方图的默认第一个),添加数据标签,得到客单价分布(箱的宽度可以自行设置)
分析:
[1,82]价格区间卖得最多,有部分商品非常昂贵,价格区间为[2350,2431],符合长尾分布的趋势
d. 选择客单价,插入直方图(直方图的默认第二个,排列图)——客单价帕累托分析
分析:对80%商品对应的价格进行关注——80%的商品价格在360以下。
e. 将透视表中的值由平均值变为计数,得到不同商品的销量。按照商品销量降序排列,插入折线图。
分析:符合长尾分布,头部商品卖得特别多,随着排序逐步提升,销量逐渐趋向于0,但下降速度减缓。
可以考虑进行排序和销量的回归分析。新建一列=LN(商品销量),双击填充列,得到LN销量列。对LN销量插入折线图,相比前一折线图而言更具有可预测性。
f. 选择商品销量,插入直方图。
帕累托分析:长尾分布在B站会员购商品中非常显著,大部分商品一天的销量在17件以下,但已经占了90%的分布.
②商品+时间双维度分析
不同商品一天24小时的订单数量统计
excel操作:
a. 选择商品编号+商品价格+下单时间等,插入数据透视表,将下单时间设置为行,商品编号设置为列,商品价格设置为值(计数项),得到每个商品在每个小时下单量
根据商品编号-销量表中销量前五名的商品编号,在数据透视表中搜索到该商品编号对应的列,将这些列筛选出来,复制到一个新表,将第一列列名设为小时,后面五列依次为销量前五名的商品编号。
全选数据,插入折线图(默认第一个),系列1-5对应销量排序1-5的商品,得到不同商品在24小时内的销量波动趋势。
分析:
大多数商品0点销量还不错,1~8低谷期,9-10点销量上升,11-19期间销量波动,有两个商品在晚8点为销量高峰,符合前述分析认知,晚9点后为正常高峰波动;有一款商品(销量第四)在11点开卖,迅速进入高峰,开始波动,晚6、7点有比较高的销量,但晚8点并不是较高的位置。
根据商品编号查看订单数据,查看对应的商品名称:销量排名前三的商品价格都比较低,只有十几块,销量比较高;排名第四的商品价格122,为一个限定限量福袋,中午12点开售,晚上停售。销量第五的商品销量相对较低,且波动不大,333元的价格偏贵,所以消费量比较低迷,但因为也是限定限量商品,所以销量也排到了前五。
③商品地区客单价分析
按商品价格和联系地址统计订单,得到不同地区的平均客单价
excel操作:
a.筛选联系地址为–的数据,把这些没有具体地址的数据删除;在剩下的数据中,新插入一列“1级地址”,第一行单元格输入=LEFT(联系地址列第一行单元格),双击填充剩余数据;选中商品价格+1级地址列,插入数据透视表,1级地址设为行,商品价格设为值(平均值项),改名为客单价并设置显示1位小数,按客单价降序排列;插入柱状图,得到不同地区客单价分布柱状图。
分析:
西藏的客单价特别高,但西藏的订单量特别少,所以是个特例,参考意义不大。
浙江客单价高,是个宝藏地区~
吉林客单价低~~

(5)B站会员购订单数据多表格数据的汇总与分析

汇总多订单表格数据后可以进行周订单波动分析、一周不同时间用户购物习惯差异分析……
方法:
①汇总周一到周日的订单数并求平均值
②选平均值最低的这一天,将权重指数设置为1
③将其他天的平均值除以平均值最低这天的平均值,得到对应的权重指数
④将7天的权重指数加起来得到周权重指数。周权重指数越与7的差距越大,波动越大,表明用户的消费习惯差距非常大,需要解决。

(6)B站会员购订单数据针对用户属性判别的分析

从订单量和客单价的时间分布,判断出主要用户——年轻人/晚睡晚起的互联网/新兴产业加班多的从业者

(7)针对地区品牌渗透度判别的分析

按联系地址统计订单数
excel操作:
a. 插入数据透视表,1级地址设为行,同时设为值(计数项),按订单数降序排列,插入柱状图。
b. 插入帕累托图,得到80%市场来自于哪些地区。
需要结合人口排名去分析品牌渗透度。通常人口多的地区订单数也就多,人口多而订单量少——品牌渗透度低。

注意:
用户画像相对于订单数据可视化更具有全面性。
分析用户画像的话,需要比较全面的数据。

  • 数据统计时间至少以季度为单位(淡旺季)
  • 数据统计商品至少以品类为单位(商品属性差异)
  • 数据统计用户至少以平台为单位(产品功能的使用局限性)

项目总结——B站会员购订单数据分析

背景

B站的会员购业务,产生了许多的订单数据,记录了交易涉及的用户、商品及订单信息。

任务

①分析是否存在恶意占货的订单,找出封禁敏感用户账号。
②统计分析订单,找到用户的消费行为习惯,进而进行精细化运营。

行动

①宏观角度,筛选已取消的订单,并按商品价格降序。将价格特高/无收货地址的已取消订单、同一地址的连续多个已取消订单初步视为恶意压货订单,根据这些订单的用户id查询其过去购买记录,如果经常存在此类操作,则视为恶意用户,需要封禁此账号。
②微观角度,从时间、地区两个维度对订单数据进行统计分析。在时间维度上,分析订单量、订单额和客单价在一天24小时的变化,得出下单量和客单价的分布情况,分析推测不同时间段的用户群体类别,进而在不同时间段开展针对性地营销操作。
③微观角度,从时间维度和地区维度统计商品的销量和客单价,根据商品销量排名和客单价分布情况,得出畅销商品的价格区间,以及高价值的地区(订单量与客单价高的地区),进而向特定地区开放特定价格的商品。
④微观角度,在地区维度上,对订单量进行统计通过帕累托分析得到订单的主要市场地区,与人口排名结合,通常人口多的省市订单量也就多,人口少而订单量高的品牌渗透度强,人口多而订单少的地区品牌渗透度低,需要关注。

结果

①分析结果显示确实存在一些恶意订单,但没有查询这些订单用户的历史购买记录。
②晚上8点,消费人群主要是购买力不高的价格敏感性消费人群,可以发放一些优惠券或者开展促销活动;晚上9点到晚上12点,增加广告的曝光量。
③热销的商品通常价格都比较低,但限时限量的商品价格稍微高一点销量也比较高,但过高的价格会影响销量。
④浙江地区的客单价高,人数少而订单数多,品牌渗透度高,是个高价值地区。

  • 0
    点赞
  • 0
    评论
  • 0
    收藏
  • 打赏
    打赏
  • 扫一扫,分享海报

©️2022 CSDN 皮肤主题:游动-白 设计师:我叫白小胖 返回首页

打赏作者

南瓜南瓜我是香橙啊

你的鼓励将是我创作的最大动力

¥2 ¥4 ¥6 ¥10 ¥20
输入1-500的整数
余额支付 (余额:-- )
扫码支付
扫码支付:¥2
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值