数据分析之——电商复盘案例

10 篇文章 1 订阅
4 篇文章 1 订阅

数据分析之——电商复盘案例

内容摘要

  • 项目背景
  • 项目目的
  • 分析思路
  • python数据分析实现

一、项目背景

  • 这是某电商平台某次促销的真实数据

  • 数据样式:

    • 表1:商品信息表
      “sale_name”:“商品名”,
      “sale_price”:“售卖价”,
      “tag_price”:“吊牌价”,
      “discout”:“折扣率”,
      “stocks”:“库存量”,
      “stocks_value”:“货值”,
      “cost_price”:“成本价”,
      “profit_rate”:“利润率”,
      “skus”:“SKU”
    • 表2:商品热度表
      “sale_name”:“商品名”,
      “uvs”:“UV数”,
      “collections”:“收藏数”,
      “carts”:“加购物车数”
    • 表3:用户销售明细表
      “user_id”:“用户id”,
      “buy_date”:“购买日期”,
      “sale_name”:“商品名”,
      “buy_cons”:“购买数量”,
      “buy_price”:“购买单价”,
      “cost_price”:“购买金额”,
      “is_tui”:“是否退货”,
      “tui_cons”:“退货件数”,
      “tui_price”:“退货金额”

    二、项目目的

    • 1、总体运营指标
    • 2、从价格区间找出表现不好的产品,优化商品结构
    • 3、从折扣区间来找出表现不好的产品,优化商品结构

    三、分析思路

    • 主要分析方法:ABC分析法
    • ABC分析的理论基础:社会上任何复杂事物,都存在着“关键的少数和一般的多数”这样一种规律。事物越是复杂,这一规律便越是显著。如果将有限的力量主要(重点)用于解决这具有决定性影响的少数事物上,和将有限力量平均分摊在全部事物上。两者比较,当然是前者可以取得较好的成效,而后者成效较差。ABC分析便是在这一思想的指导下,通过分析,将“关键的少数”找出来,并确定与之适应的管理方法,这便形成了要进行重点管理的A类事物。这就能够以“一倍的努力取得7—8倍的效果”。
    • 本次通过ABC分析法,评估每次促销活动的结果,并根据情况优化商品结构,以便让自己的商品卖的更好。

    四、python数据分析实现

    • 1、数据整理
#导入函数库
import pandas as pd
import pandas as pd
import numpy as np
import warnings
warnings.filterwarnings('ignore')

#连接数据库,提取数据
import sqlalchemy
engine = sqlalchemy.create_engine('mysql+pymysql://XXXXXXXX/XXXXXX')

# 读取数据
# 1、商品信息表
sql_cmd = "select * from sales_info1"
# 执行sql语句,获取数据
dt1 = pd.read_sql(sql=sql_cmd, con=engine)
dt1.rename(columns={"sale_name":"商品名",
                    "sale_price":"售卖价",
                    "tag_price":"吊牌价",
                    "discout":"折扣率",
                    "stocks":"库存量",
                    "stocks_value":"货值",
                    "cost_price":"成本价",
                    "profit_rate":"利润率",
                    "skus":"SKU"},
          inplace=True)
# 2、商品热度表
sql_cmd = "select * from sales_info2"
# 执行sql语句,获取数据
dt2 = pd.read_sql(sql=sql_cmd, con=engine)
dt2.rename(columns={"sale_name":"商品名",
                    "uvs":"UV数",
                    "collections":"收藏数",
                    "carts":"加购物车数"},
          inplace=True)
#3、用户销售明细表
sql_cmd = "select * from sales_info3"
# 执行sql语句,获取数据
dt3 = pd.read_sql(sql=sql_cmd, con=engine)
dt3.rename(columns={"user_id":"用户id",
                    "buy_date":"购买日期",
                    "sale_name":"商品名",
                    "buy_cons":"购买数量",
                    "buy_price":"购买单价",
                    "cost_price":"购买金额",
                    "is_tui":"是否退货",
                    "tui_cons":"退货件数",
                    "tui_price":"退货金额"},
          inplace=True)
#将退货数据进行处理          
dt3['是否退货']=dt3["是否退货"].map({"是":1,"否":0})          

表1
表1
表2
在这里插入图片描述
表3
在这里插入图片描述

#合并三张表

#合并商品信息表和商品热度表数据
dt_product = dt1.merge(dt2,how="left",on="商品名")

#合并商品信息表和商品热度表数据和用户销售明细表
#需要对用户销售明细表根据商品id进行groupby
product_sales = dt3.groupby("商品名").agg({"购买数量":"sum",
                                                 "购买金额":"sum",
                                                 "退货件数":"sum",
                                                 "退货金额":"sum",
                                                 "购买单价":"mean",
                                                 "用户id":pd.Series.nunique}).reset_index()
product_sales.rename(columns={"购买数量":"商品销售数量",
                              "购买金额":"商品销售金额",
                              "是否退货":"商品退货数量",
                              "退货金额":"商品退货金额",
                              "购买单价":"商品销售单价",
                              "用户id":"购买用户数量"},inplace=True)

# 合并商品信息
dt_product_sales = dt_product.merge(product_sales,how="left",on="商品名")
dt_product_sales.head()                             

在这里插入图片描述

  • 2、总体运营指标
    总体运营部分,主要关注销售额、售卖比、UV、转化率等指标,其他指标作为辅助指标。销售额用来和预期目标做对比,售卖比用来看商品流转情况。
#1、GMV:销售额,包含退货的金额
gmv = dt_product_sales["商品销售金额"].sum()
#3747167.0
#2、实际销售额=GMV - 退货金额
return_sales = dt_product_sales["商品退货金额"].sum()
return_money = gmv - return_sales
#2607587.0
#3、销量:累计销售量(含拒退)
all_sales = dt_product_sales["商品销售数量"].sum()
#12017
#4、客单价:GMV / 客户数,客单价与毛利率息息相关,一般客单价越高,毛利率越高。
custom_price = gmv / dt_product_sales["购买用户数量"].sum()
#493.56783456269756
# 5、UV:商品所在页面的独立访问数
uv_cons = dt_product_sales["UV数"].sum()
#1176103
# 6、转化率:客户数 / UV。
uv_rate = dt_product_sales["购买用户数量"].sum() / dt_product_sales["UV数"].sum()
#0.006455216932530569
# 7、折扣率:GMV / 吊牌总额(吊牌总额 = 吊牌价 * 销量),在日常工作中,吊牌额是必不可少的。
tags_sales = np.sum(dt_product_sales["吊牌价"] * dt_product_sales["商品销售数量"])
discount_rate= gmv / tags_sales 
#0.4179229541452886
# 8、备货值:吊牌价 * 库存数。
goods_value = dt_product_sales["货值"].sum()
#18916395
# 9、售卖比:又称售罄率,GMV / 备货值。
sales_rate = gmv / goods_value
#0.19809096817866195
# 10、收藏数:收藏某款商品的用户数量。
coll_cons = dt_product_sales["收藏数"].sum()
#6224
# 11、加购数:加购物车人数。
add_shop_cons = dt_product_sales["加购物车数"].sum()
#18690
# 12、SKU数:促销活动中的最小品类单元(一般指货号)。
sku_cons = dt_product_sales["SKU"].sum()
#125
# 13、SPU数:促销活动中的SPU计数(一般指款号)。
spu_cons = len(dt_product_sales["商品名"].unique())
#80
# 14、拒退量:拒收和退货的总数量。退货件数
reject_cons = dt_product_sales["退货件数"].sum()
#3643
# 15、拒退额:拒收和退货的总金额。
reject_money = dt_product_sales["商品退货金额"].sum()
#1139580.0
# 汇总统计
sales_state_dangqi = pd.DataFrame(
    {"GMV":[gmv,],"实际销售额":[return_money,],"销量":[all_sales,],"客单价":[custom_price,],
     "UV数":[uv_cons,],"UV转化率":[uv_rate,],"折扣率":[discount_rate,],"货值":[goods_value,],
     "售卖比":[sales_rate,],"收藏数":[coll_cons,],"加购数":[add_shop_cons,],"sku数":[sku_cons,],
     "spu数":[spu_cons,],"拒退量":[reject_cons,],"拒退额":[reject_money,],}, 
    ) #index=["今年双11",]

# 去年的数据是已经统计好了的,这里用来做展示,不需要计算(写死的内容)
sales_state_tongqi = pd.DataFrame(
    {"GMV":[2261093,],"实际销售额":[1464936.517,],"销量":[7654,],"客单价":[609.34567,],
     "UV数":[904694,],"UV转化率":[0.0053366,],"折扣率":[0.46,],"货值":[12610930,],
     "售卖比":[0.1161,],"收藏数":[4263,],"加购数":[15838,],"sku数":[82,],
     "spu数":[67,],"拒退量":[2000,],"拒退额":[651188.57,],}, 
    ) #index=["去年双11",]

#sales_state = pd.concat([sales_state_dangqi, sales_state_tangqi])
sales_state_dangqi_s = pd.DataFrame(sales_state_dangqi.stack()).reset_index().iloc[:,[1,2]]
sales_state_dangqi_s.columns = ["指标","今年双11"]
sales_state_tongqi_s = pd.DataFrame(sales_state_tongqi.stack()).reset_index().iloc[:,[1,2]]
sales_state_tongqi_s.columns = ["指标","去年双11"]
sales_state = pd.merge(sales_state_dangqi_s, sales_state_tongqi_s,on="指标")
sales_state["同比"] = (sales_state["今年双11"] - sales_state["去年双11"]) / sales_state["去年双11"]
sales_state

在这里插入图片描述

  • 3、从价格区间找出表现不好的产品,优化商品结构
    我们需要做的是,深入探究不同区间的数据,以此来优化后期的促销结构。首先我们需要找到在本次促销中此区间的销售源数据,源数据要求显示具体的款号、销售额、销量等信息。第二步,计算出每个款的转化率、折扣率等数据。
# 划分价格区间段
#设置切分区域
listBins = [0,200, 400, 100000]
#设置切分后对应标签
listLabels = ['1_200','200_400','400及以上']
#利用pd.cut进行数据离散化切分,注意分组标签和分组数要一致
dt_product_sales['价格分组'] = pd.cut(dt_product_sales['售卖价'], bins=listBins, labels=listLabels, include_lowest=True)

在这里插入图片描述

# 货值、商品销售金额、商品销售数量、UV数、购买用户数量、收藏数、加购物车数、货值占比、销售占比、客单价、转化率
dt_product_sales_info = dt_product_sales.groupby("价格分组").agg({
                                        "货值":"sum",
                                        "商品销售金额":"sum",
                                        "商品销售数量":"sum",
                                        "UV数":"sum",
                                        "购买用户数量":"sum",
                                        "收藏数":"sum",
                                        "加购物车数":"sum"
                                        }).reset_index()
dt_product_sales_info["货值占比"]=dt_product_sales_info["货值"]/dt_product_sales_info["货值"].sum()
dt_product_sales_info["销售占比"]=dt_product_sales_info["商品销售金额"]/dt_product_sales_info["商品销售金额"].sum()
dt_product_sales_info["客单价"]=dt_product_sales_info["商品销售金额"]/dt_product_sales_info["购买用户数量"]
dt_product_sales_info["转化率"]=dt_product_sales_info["购买用户数量"]/dt_product_sales_info["UV数"]                                       

在这里插入图片描述
可以看出400以上为主要商品销售金额来源,故对此进行ABC分析

# 取出400及以上价格区间的数据内容
product_400 = dt_product_sales[dt_product_sales["价格分组"]=='400及以上']

# 转换率=客户数 / UV
product_400['转换率'] = product_400["购买用户数量"]/product_400["UV数"]
# 备货值=吊牌价 * 库存数
product_400["备货值"] = product_400["吊牌价"]*product_400["库存量"]
# 售卖比=又称售罄率,GMV / 备货值
product_400["售卖比"] = product_400["商品销售金额"]/product_400["备货值"]

#结果展示
product_400[["商品名","商品销售金额","商品销售数量","商品销售单价","购买用户数量","UV数",'转换率',"库存量","备货值","售卖比"]]

在这里插入图片描述

  • 优化方案:
    • 转化率大于0.7%的商品,暂时保留,用于下次促销活动;
    • 转化率小于0.7%的商品,但是售卖比大于36%的商品予以保留参加下次促销活动,
    • 转化率小于0.7%的商品,并且售卖比小于36%的商品进行清仓处理。
# 挑选合格的商品:
# 1、保留商品:转化率大于0.7%的商品予以保留
stay_stocks571 = product_400[product_400["转换率"]>0.007]
# 2、保留商品:找出转化率小于0.7% 但是 售卖比大于36%的部分予以保留
stay_stocks573 = product_400[(product_400["售卖比"]>=0.36)&(product_400["转换率"]<0.007)]
# 3、清仓处理商品,找出转化率小于0.7%并且售卖比小于36%的部分
stay_stocks574 = product_400[(product_400["售卖比"]<0.36)&(product_400["转换率"]<0.007)]
  • 4、从折扣区间来找出表现不好的产品,优化商品结构
# 划分价格区间段
#设置切分区域
listBins = [0.15, 0.2, 0.25, 0.3, 0.35, 0.4, 0.45, 0.5, 0.55, 0.6, 0.65, 0.7, 1]
#设置切分后对应标签
listLabels = ['0.15_0.2','0.2_0.25','0.25_0.3','0.3_0.35','0.35_0.4','0.4_0.45','0.45_0.5','0.5_0.55','0.55_0.6','0.6_0.65','0.65_0.7','0.7_1']
#利用pd.cut进行数据离散化切分,注意分组标签和分组数要一致
dt_product_sales['折扣区间'] = pd.cut(dt_product['折扣率'], bins=listBins, labels=listLabels, include_lowest=True)
dt_product_sales.head()

在这里插入图片描述

#对折扣区间进行groupby
# 商品名、售卖价、吊牌价、折扣率、库存量、货值、成本价、利润率、SKU、UV数、收藏数、加购物车数、商品销售数量、商品销售金额、退货件数、商品退货金额、商品销售单价、购买用户数量、价格分组、折扣区间
dt_product_discount_info = dt_product_sales.groupby("折扣区间").agg({
                                        "货值":"sum",
                                        "商品销售金额":"sum",
                                        "商品销售数量":"sum",
                                        "UV数":"sum",
                                        "购买用户数量":"sum",
                                        "收藏数":"sum",
                                        "加购物车数":"sum"
                                        }).reset_index()
dt_product_discount_info["货值占比"]=dt_product_discount_info["货值"]/dt_product_discount_info["货值"].sum()
dt_product_discount_info["销售占比"]=dt_product_discount_info["商品销售金额"]/dt_product_discount_info["商品销售金额"].sum()
dt_product_discount_info["客单价"]=dt_product_discount_info["商品销售金额"]/dt_product_discount_info["购买用户数量"]
dt_product_discount_info["转化率"]=dt_product_discount_info["购买用户数量"]/dt_product_discount_info["UV数"]                                        

在这里插入图片描述
可以看出0.35-0.4折扣区间为主要商品销售金额来源,故对此进行ABC分析

# 取出0.35-0.4价格区间的数据内容
product_354 = dt_product_sales[dt_product_sales["折扣区间"]=='0.35_0.4']
# 转换率=客户数 / UV
product_354['转换率'] = product_354["购买用户数量"]/product_354["UV数"]
# 备货值=吊牌价 * 库存数
product_354["备货值"] = product_354["吊牌价"]*product_354["库存量"]
# 售卖比=又称售罄率,GMV / 备货值
product_354["售卖比"] = product_354["商品销售金额"]/product_354["备货值"]
#结果展示
product_354[["商品名","商品销售金额","商品销售数量","商品销售单价","购买用户数量","UV数","库存量","备货值","折扣率","售卖比",'转换率']]
  • 优化方案:
    • 折扣率**大于37%**的部分找出售卖比大于36.5%且转化率大于0.7%的商品予以保留,其余进行清仓处理;
    • 折扣率**小于37%**的部分找出售卖比大于36.5%且转化率大于0.7%的部分予以保留,其余进行清仓处理。
# 挑选合格的商品:
# 1、保留商品:折扣率大于37%的部分找出售卖比大于36.5%且转化率大于0.7%的商品予以保留
stay_stocks1 = product_354[(product_354["折扣率"]>0.37)&(product_354["售卖比"]>0.365)&(product_354["转换率"]>0.007)]
# 2、清仓处理商品,不满足条件的:折扣率大于37%的部分找出售卖比小于36.5%或转化率小于0.7%的商品
# 取反即可
stay_stocks2 = product_354[(product_354["折扣率"]>=0.37)&((product_354["售卖比"]<=0.365)|(product_354["转换率"]<=0.007))]
# 3、保留商品:在折扣率小于37%的部分找出售卖比大于36.5%且转化率大于0.7%的部分予以保留
stay_stocks3 = product_354[(product_354["折扣率"]<=0.37)&(product_354["转换率"]>0.007)&(product_354["售卖比"]>0.365)] 
# 4、清仓处理商品,不满足此条件的:在折扣率小于37%的部分找出售卖比小于36.5%或转化率小于0.7%的部分
# 取反即可
stay_stocks4 = product_354[((product_354["折扣率"]<0.37) & ((product_354["售卖比"]<0.365)|(product_354["转换率"]<0.007)))]
  • 1
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值