python电商项目源码_电商平台某活动销售数据复盘-附python完整代码

假设我司是一家集产研销一体的公司,在某电商平台上长期销售商品。基于平台现有的销售模式,我司每个月都会有一场以上促销活动,每次促销活动后我们都会评估其结果,并做出相关改进。分析流程:1、总体运营指标分析

2、从价格区间中根据转化率和售卖比优化产品结构

3、从折扣区间优化产品结构

import pandas as pd

import numpy as np

import warnings

warnings.filterwarnings('ignore')

此次分析的目标:

评估每次促销活动的结果,并根据情况优化商品结构,以便让自己的商品卖的更好。

1、读取各部分数据集

# 读取数据

# 商品信息表

dt1 = pd.read_excel(r"唯品会销售数据.xlsx",sheetname=0)

# dt1.rename(columns={"商品名":"product_name",

# "售卖价":"sale_price",

# "吊牌价":"tag_price",

# "折扣率":"discount_rate",

# "库存量":"stock_nums",

# "成本价":"cost_price",

# "利润率":"profit_rate",

# "SPU(款式)":"spu_nums"},inplace=True)

dt1.head()

# 读取数据

# 商品热度信息

dt2 = pd.read_excel("唯品会销售数据.xlsx",sheetname=1)

# dt2.rename(columns={"商品名":"product_name",

# "UV数":"uv_nums",

# "收藏数":"collect_nums",

# "加购物车数":"shopping_carts"},inplace=True)

dt2.head()

# 读取数据

# 用户销售明细表

dt3 = pd.read_excel("唯品会销售数据.xlsx",sheetname=2)

# dt3.rename(columns={"用户id":"user_id",

# "购买日期":"buy_date",

# "购买商品":"product_name",

# "购买数量":"buy_cons",

# "购买单价":"unit_price",

# "购买金额":"buy_cost",

# "是否退货":"is_return"},inplace=True)

# 把是否退货转换为0-1,方便后面统计

# dt3['is_return']=dt3.is_return.map({"是":1,"否":0})

dt3['是否退货']=dt3["是否退货"].map({"是":1,"否":0})

dt3.head()

2、合并商品信息表和商品热度表数据

# 把商品信息加上该商品的热度信息

# 得到基础的商品信息,以及商品的一些热度信息:加购物车数量,收藏数量、uv数

# dt_product = dt1.merge(dt2,how="left",on="product_name")

dt_product = dt1.merge(dt2,how="left",on="商品名")

dt_product.head()

3、合并商品信息表和商品热度表数据和用户销售明细表

# 统计每个商品的一个销售情况

# 商品购买数量

# 商品退货数量

# 商品销售单价

# 商品购买用户数量(一个用户只计算一次)

# product_sales = dt3.groupby("product_name").agg({"buy_cons":"sum",

# "buy_cost":"sum",

# "is_return":"sum",

# "unit_price":"mean",

# "user_id":pd.Series.nunique}).reset_index()

product_sales = dt3.groupby("商品名").agg({"购买数量":"sum",

"购买金额":"sum",

"退货件数":"sum",

"退货金额":"sum",

"购买单价":"mean",

"用户id":pd.Series.nunique}).reset_index()

product_sales.rename(columns={"购买数量":"商品销售数量",

"购买金额":"商品销售金额",

"是否退货":"商品退货数量",

"退货金额":"商品退货金额",

"购买单价":"商品销售单价",

"用户id":"购买用户数量"},inplace=True)

product_sales.head()

# 合并商品信息

# dt_product_sales = dt_product.merge(product_sales,how="left",on="product_name")

dt_product_sales = dt_product.merge(product_sales,how="left",on="商品名")

dt_product_sales.head()

一、总体运营情况评价

总体运营部分,主要关注销售额、售卖比、UV、转化率等指标,其他指标作为辅助指标。销售额用来和预期目标做对比,售卖比用来看商品流转情况。GMV:销售额,在唯品会里称为到手价。

实销:GMV – 拒退金额。

销量:累计销售量(含拒退)。

客单价:GMV / 客户数,客单价与毛利率息息相关,一般客单价越高,毛利率越高。

UV:商品所在页面的独立访问数。

转化率:客户数 / UV。

折扣率:GMV / 吊牌总额(吊牌总额 = 吊牌价 * 销量),在日常工作中,吊牌额是必不可少的。

备货值:吊牌价 * 库存数。

售卖比:又称售罄率,GMV / 备货值。

收藏数:收藏某款商品的用户数量。

加购数:加购物车人数。

SKU数:促销活动中的SKU计数(一般指货号)。

SPU数:促销活动中的SPU计数(一般指款号)。

拒退量:拒收和退货的总数量。

拒退额:拒收和退货的总金额。电商数据分析指标体系

#1、GMV:销售额,包含退货的金额

gmv = dt_product_sales["商品销售金额"].sum()

gmv

3747167

#2、实际销售额=GMV - 退货金额

return_sales = dt_product_sales["商品退货金额"].sum()

return_money = gmv - return_sales

return_money

2607587

#3、销量:累计销售量(含拒退)

all_sales = dt_product_sales["商品销售数量"].sum()

all_sales

12017

#4、客单价:GMV / 客户数,客单价与毛利率息息相关,一般客单价越高,毛利率越高。

# dt3.user_id.unique().count()

custom_price = gmv / dt_product_sales["购买用户数量"].sum()

custom_price

493.56783456269756

# 5、UV:商品所在页面的独立访问数

uv_cons = dt_product_sales["UV数"].sum()

uv_cons

1176103

# 6、转化率:客户数 / UV。

uv_rate = dt_product_sales["购买用户数量"].sum() / dt_product_sales["UV数"].sum()

uv_rate

0.006455216932530569

# 7、折扣率:GMV / 吊牌总额(吊牌总额 = 吊牌价 * 销量),在日常工作中,吊牌额是必不可少的。

tags_sales = np.sum(dt_product_sales["吊牌价"] * dt_product_sales["商品销售数量"])

discount_rate= gmv / tags_sales

discount_rate

0.4179229541452886

# 8、备货值:吊牌价 * 库存数。

goods_value = dt_product_sales["货值"].sum()

goods_value

18916395

# 9、售卖比:又称售罄率,GMV / 备货值。

sales_rate = gmv / goods_value

sales_rate

0.19809096817866195

# 10、收藏数:收藏某款商品的用户数量。

coll_cons = dt_product_sales["收藏数"].sum()

coll_cons

6224

# 11、加购数:加购物车人数。

add_shop_cons = dt_product_sales["加购物车数"].sum()

add_shop_cons

18690

# 12、SKU数:促销活动中的最小品类单元(一般指货号)。

sku_cons = dt_product_sales["SKU"].sum()

sku_cons

125

# 13、SPU数:促销活动中的SPU计数(一般指款号)。

spu_cons = len(dt_product_sales["商品名"].unique())

spu_cons

80

# 14、拒退量:拒收和退货的总数量。退货件数

reject_cons = dt_product_sales["退货件数"].sum()

reject_cons

3643

# 15、拒退额:拒收和退货的总金额。

reject_money = dt_product_sales["商品退货金额"].sum()

reject_money

1139580

# 汇总统计

sales_state_dangqi = pd.DataFrame(

{"GMV":[gmv,],"实际销售额":[return_money,],"销量":[all_sales,],"客单价":[custom_price,],

"UV数":[uv_cons,],"UV转化率":[uv_rate,],"折扣率":[discount_rate,],"货值":[goods_value,],

"售卖比":[sales_rate,],"收藏数":[coll_cons,],"加购数":[add_shop_cons,],"sku数":[sku_cons,],

"spu数":[spu_cons,],"拒退量":[reject_cons,],"拒退额":[reject_money,],},

) #index=["今年双11",]

sales_state_tongqi = pd.DataFrame(

{"GMV":[2261093,],"实际销售额":[1464936.517,],"销量":[7654,],"客单价":[609.34567,],

"UV数":[904694,],"UV转化率":[0.0053366,],"折扣率":[0.46,],"货值":[12610930,],

"售卖比":[0.1161,],"收藏数":[4263,],"加购数":[15838,],"sku数":[82,],

"spu数":[67,],"拒退量":[2000,],"拒退额":[651188.57,],},

) #index=["去年双11",]

"""sales_state_tongqi = pd.DataFrame({"GMV":["NaN",],"实际销售额":[return_money,],"销量":[all_sales,],"客单价":[custom_price,],"UV数":[uv_cons,],"UV转化率":[uv_rate,],"折扣率":[discount_rate,],"货值":[goods_value,],"货值":[goods_value,],"售卖比":[sales_rate,],"收藏数":[coll_cons,],"加购数":[add_shop_cons,],"sku数":[sku_cons,],"spu数":[spu_cons,],"拒退量":[reject_cons,],"拒退额":[reject_money,],}, index=["去年双11"])"""

#sales_state = pd.concat([sales_state_dangqi, sales_state_tangqi])

sales_state_dangqi_s = pd.DataFrame(sales_state_dangqi.stack()).reset_index().iloc[:,[1,2]]

sales_state_dangqi_s.columns = ["指标","今年双11"]

sales_state_tongqi_s = pd.DataFrame(sales_state_tongqi.stack()).reset_index().iloc[:,[1,2]]

sales_state_tongqi_s.columns = ["指标","去年双11"]

sales_state = pd.merge(sales_state_dangqi_s, sales_state_tongqi_s,on="指标")

sales_state["同比"] = (sales_state["今年双11"] - sales_state["去年双11"]) / sales_state["去年双11"]

sales_state

结论:今年的GMV,销售额、销量等主要指标均较去年同比大幅上涨。

客单价下降19%,说明整体产品定位更加亲民。在一定程度上带动了销量的增长。

折扣率降低9.15%,今年的折扣力度变小。

SKU和SPU同比增长52.44%和19.4%,说明产品种类更加丰富,消费者有了更多的选择。

拒退量和拒退额同样大幅上涨,分别涨幅82.15%和75%,应该退出办法给以控制,降低成本。

二、从价格区间来优化商品结构

我们需要做的是,深入探究不同区间的数据,以此来优化后期的促销结构。以400及以上价格区间为例,首先我们需要找到在本次促销中此区间的销售源数据,源数据要求显示具体的款号、销售额、销量等信息。第二步,计算出每个款的转化率、折扣率等数据,这些数据的作用是与dt_product_sales_info输出结果中400及以上价格区间的值做对比。

查看指标:销售额

销量

件单价

客户数

UV

转换率

库存

货值

售卖比

转化率大于0.7%的商品我们暂时保留,用于下次促销活动;转化率小于0.7%部分,售卖比大于36%的商品予以保留参加下次促销活动,售卖比小于36%的商品进行清仓处理。

# 划分价格区间段

#设置切分区域

listBins = [0,200, 400, 100000]

#设置切分后对应标签

listLabels = ['1_200','200_500','400及以上']

#利用pd.cut进行数据离散化切分,注意分组标签和分组数要一致

"""pandas.cut(x,bins,right=True,labels=None,retbins=False,precision=3,include_lowest=False)x:需要切分的数据bins:切分区域right : 是否包含右端点默认True,包含labels:对应标签,用标记来代替返回的bins,若不在该序列中,则返回NaNretbins:是否返回间距binsprecision:精度include_lowest:是否包含左端点,默认False,不包含"""

dt_product_sales['价格分组'] = pd.cut(dt_product_sales['售卖价'], bins=listBins, labels=listLabels, include_lowest=True)

dt_product_sales.head()

价格区间销售情况统计价格区间

货值

货值占比

销售额

售卖比

销售占比

销量

客单价

UV

收藏数

加购数

转化率

# 货值占比、销售占比、客单价、转化率 后面求

dt_product_sales_info = dt_product_sales.groupby("价格分组").agg({

"货值":"sum",

"商品销售金额":"sum",

"商品销售数量":"sum",

# "客单价":"mean",

"UV数":"sum",

"购买用户数量":"sum",

"收藏数":"sum",

"加购物车数":"sum"

}).reset_index()

dt_product_sales_info.head()

# 货值占比、销售占比、客单价、转化率 后面求

dt_product_sales_info["货值占比"]=dt_product_sales_info["货值"]/dt_product_sales_info["货值"].sum()

dt_product_sales_info["销售占比"]=dt_product_sales_info["商品销售金额"]/dt_product_sales_info["商品销售金额"].sum()

dt_product_sales_info["客单价"]=dt_product_sales_info["商品销售金额"]/dt_product_sales_info["购买用户数量"]

dt_product_sales_info["转化率"]=dt_product_sales_info["购买用户数量"]/dt_product_sales_info["UV数"]

dt_product_sales_info.head()

# 取出400及以上价格区间的数据内容

product_400 = dt_product_sales[dt_product_sales["价格分组"]=='400及以上']

product_400.head()

计算商品指标销售额

销量

件单价

客户数

UV

转换率=客户数 / UV

库存

备货值=吊牌价 * 库存数

售卖比=又称售罄率,GMV / 备货值

# 转换率=客户数 / UV

product_400['转换率'] = product_400["购买用户数量"]/product_400["UV数"]

# 备货值=吊牌价 * 库存数

product_400["备货值"] = product_400["吊牌价"]*product_400["商品销售数量"]

product_400.head()

# 售卖比=又称售罄率,GMV / 备货值

product_400["售卖比"] = product_400["商品销售金额"]/product_400["备货值"]

product_400.head()

product_400[["商品名","商品销售金额","商品销售数量","商品销售单价","购买用户数量","UV数",'转换率',"库存量","备货值","售卖比"]]

优化结果:转化率大于0.7%的商品,暂时保留,用于下次促销活动;

转化率小于0.7%的商品,但是售卖比大于36%的商品予以保留参加下次促销活动,

转化率小于0.7%的商品,并且售卖比小于36%的商品进行清仓处理。

这里找出B008、C003、C007、 D007四款产品需要清仓处理

# 挑选合格的商品:

# 1、保留商品:找出售卖比大于36%且转化率大于0.7%的商品予以保留

stay_stocks571 = product_400[product_400["转换率"]>0.007]

stay_stocks571

# 挑选合格的商品:

# 2、保留商品:找出售卖比大于36%且转化率大于0.7%的部分予以保留

stay_stocks573 = product_400[(product_400["售卖比"]>=0.36)&(product_400["转换率"]<0.007)]

stay_stocks573

# 4、清仓处理商品,找出售卖比小于36%且转化率大于0.7%的部分

# 取反即可

stay_stocks574 = product_400[(product_400["售卖比"]<0.36)&(product_400["转换率"]<0.007)]

stay_stocks574

三、从折扣区间来优化商品结构

同样地,我们选择0.35-0.4折扣区间进行深入探究。dt_product_discount_info表中,我们可以得到0.35-0.4折扣区间的售卖比为16.90%,转化率为0.53%,折扣率为37%,在进行商品结构优化的时候要着重对比这几个指标。

查看指标:销售额

销量

件单价

客户数

UV

转换率=客户数 / UV

库存

备货值=吊牌价 * 库存数

售卖比=又称售罄率,GMV / 备货值

在折扣率大于37%的部分找出售卖比大于36.5%且转化率大于0.7%的商品予以保留,其余进行清仓处理;在折扣率小于37%的部分找出售卖比大于36.5%且转化率大于0.7%的部分予以保留,其余进行清仓处理。

dt_product_sales.head()

# 划分价格区间段

#设置切分区域

listBins = [0.15, 0.2, 0.25, 0.3, 0.35, 0.4, 0.45, 0.5, 0.55, 0.6, 0.65, 0.7, 1]

#设置切分后对应标签

listLabels = ['0.15_0.2','0.2_0.25','0.25_0.3','0.3_0.35','0.35_0.4','0.4_0.45','0.45_0.5','0.5_0.55','0.55_0.6','0.6_0.65','0.65_0.7','0.7_1']

#利用pd.cut进行数据离散化切分,注意分组标签和分组数要一致

"""pandas.cut(x,bins,right=True,labels=None,retbins=False,precision=3,include_lowest=False)x:需要切分的数据bins:切分区域right : 是否包含右端点默认True,包含labels:对应标签,用标记来代替返回的bins,若不在该序列中,则返回NaNretbins:是否返回间距binsprecision:精度include_lowest:是否包含左端点,默认False,不包含"""

dt_product_sales['折扣区间'] = pd.cut(dt_product['折扣率'], bins=listBins, labels=listLabels, include_lowest=True)

dt_product_sales.head()

折扣区间销售情况统计价格区间

货值

货值占比

销售额

售卖比

销售占比

销量

客单价

UV

收藏数

加购数

转化率

# 货值占比、销售占比、客单价、转化率 后面求

dt_product_discount_info = dt_product_sales.groupby("折扣区间").agg({

"货值":"sum",

"商品销售金额":"sum",

"商品销售数量":"sum",

"UV数":"sum",

"购买用户数量":"sum",

"收藏数":"sum",

"加购物车数":"sum"

}).reset_index()

dt_product_discount_info

# 货值占比、销售占比、客单价、转化率 后面求

dt_product_discount_info["货值占比"]=dt_product_discount_info["货值"]/dt_product_discount_info["货值"].sum()

dt_product_discount_info["销售占比"]=dt_product_discount_info["商品销售金额"]/dt_product_discount_info["商品销售金额"].sum()

dt_product_discount_info["客单价"]=dt_product_discount_info["商品销售金额"]/dt_product_discount_info["购买用户数量"]

dt_product_discount_info["转化率"]=dt_product_discount_info["购买用户数量"]/dt_product_discount_info["UV数"]

dt_product_discount_info

# 取出0.25-0.3价格区间的数据内容

product_354 = dt_product_sales[dt_product_sales["折扣区间"]=='0.35_0.4']

product_354.head()

计算商品指标销售额

销量

件单价

客户数

UV

转换率=客户数 / UV

库存

货值=吊牌价 * 库存数

售卖比=又称售罄率,GMV / 备货值

# 转换率=客户数 / UV

product_354['转换率'] = product_354["购买用户数量"]/product_354["UV数"]

# 备货值=吊牌价 * 库存数

product_354["备货值"] = product_354["吊牌价"]*product_354["商品销售数量"]

product_354.head()

# 售卖比=又称售罄率,GMV / 备货值

product_354["售卖比"] = product_354["商品销售金额"]/product_354["备货值"]

product_354.head()

product_354[["商品名","商品销售金额","商品销售数量","商品销售单价","购买用户数量","UV数","库存量","备货值","折扣率","售卖比",'转换率']]

# 挑选合格的商品:

# 1、保留商品:折扣率大于37%的部分找出售卖比大于36.5%且转化率大于0.7%的商品予以保留

stay_stocks1 = product_354[(product_354["折扣率"]>0.37)&(product_354["售卖比"]>0.365)&(product_354["转换率"]>0.007)]

stay_stocks1

# 2、清仓处理商品,不满足条件的:折扣率大于37%的部分找出售卖比小于36.5%或转化率小于0.7%的商品

# 取反即可

stay_stocks2 = product_354[(product_354["折扣率"]>=0.37)&((product_354["售卖比"]<=0.365)|(product_354["转换率"]<=0.007))] #

stay_stocks2

# 挑选合格的商品:

# 3、保留商品:在折扣率小于37%的部分找出售卖比大于36.5%且转化率大于0.7%的部分予以保留

stay_stocks3 = product_354[(product_354["折扣率"]<=0.37)&(product_354["转换率"]>0.007)&(product_354["售卖比"]>0.365)]

stay_stocks3

# 4、清仓处理商品,不满足此条件的:在折扣率小于37%的部分找出售卖比小于36.5%或转化率小于0.7%的部分

# 取反即可

stay_stocks4 = product_354[((product_354["折扣率"]<0.37) & ((product_354["售卖比"]<0.365)|(product_354["转换率"]<0.007)))]

stay_stocks4

优化结果: - 折扣率大于37%的部分找出售卖比大于36.5%且转化率大于0.7%的商品予以保留,其余进行清仓处理;折扣率小于37%的部分找出售卖比大于36.5%且转化率大于0.7%的部分予以保留,其余进行清仓处理。

四、流量分布

在一级入口中,首页的流量占比为71%,其中档期流的流量占比最高,我们可以将畅销款布局在首页档期流。在唯品会中,我们需要不断的增加商品来保证我们的SKU数,对于新增的商品我们也会增加在其中。对于平销款,我们将其作为快抢和疯抢处理。

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值