python数据分析小案例:天猫订单数据综合分析

本文通过Python分析了天猫一个月内的28010条订单数据,包括订单转化漏斗图、订单时间趋势及销量地理分布。研究显示,天猫的总体转化率高,2月上半月因企业未复工和快递停运导致订单数低,下半月订单数随着复工增加而上涨。
摘要由CSDN通过智能技术生成

嗨喽~大家好呀,这里是魔王呐 ❤ ~!

python更多源码/资料/解答/教程等 点击此处跳转文末名片免费获取

本数据集共收集了发生在一个月内的28010条数据,包含以下:

7个字段说明

  1. 订单编号:订单编号

  2. 总金额:订单总金额

  3. 买家实际支付金额:总金额 - 退款金额(在已付款的情况下)。金额为0(在未付款的情况下)

  4. 收货地址:各个省份

  5. 订单创建时间:下单时间

  6. 订单付款时间:付款时间

  7. 退款金额:付款后申请退款的金额。如无付过款,退款金额为0

分析目的

  1. 订单每个环节的转化转化率

  2. 订单成交的时间(按天)趋势(按实际成交)

  3. 订单数在地图上的分布

订单读取及处理

读取数据
import pandas as pd
df = pd.read_csv('tmall_order_report.csv',encoding='gbk')
df.head()

处理数据
df.columns
'''
遇到问题没人解答?小编创建了一个Python学习交流QQ群:926207505
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
# 将字段名称中空格去掉,规范字段名称
df = df.rename( columns = {
   '收货地址 ':'收货地址','订单付款时间 ':'订单付款时间'} )
df.columns

df.info()

重复值

df.duplicated().sum()

缺失值

df.isnull().sum()
# 订单付款时间 有2923个缺失值,属于正常现象,说明这些单位付过款,无需处理

订单转化率-漏斗图

计算每个环节的数据
  • 将得到如下的数据:

    [[‘总订单数’, ‘28010’],

    [‘付款订单数’, ‘24087’],

    [‘到款订单数’, ‘18955’],

    [‘全额到款订单数’, ‘18441’]]

    买家实际支付金额:总金额 - 退款金额(在已付款的情况下)。金额为0(在未付款的情况下)

    退款金额:付款后申请退款的金额。如无付过款,退款金额为0

订单总笔数
dict_convs = dict()
key = '总订单数'
dict_convs[key] = len(df)
len(df)
付过款的订单数
'''
遇到问题没人解答?小编创建了一个Python学习交流QQ群:926207505
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
key = '付款订单数'

# 付款时间不为空的,表示付过款
df_payed = df[df['订单付款时间'
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值