嗨喽~大家好呀,这里是魔王呐 ❤ ~!
python更多源码/资料/解答/教程等 点击此处跳转文末名片免费获取
本数据集共收集了发生在一个月内的28010条数据,包含以下:
7个字段说明
-
订单编号:订单编号
-
总金额:订单总金额
-
买家实际支付金额:总金额 - 退款金额(在已付款的情况下)。金额为0(在未付款的情况下)
-
收货地址:各个省份
-
订单创建时间:下单时间
-
订单付款时间:付款时间
-
退款金额:付款后申请退款的金额。如无付过款,退款金额为0
分析目的
-
订单每个环节的转化转化率
-
订单成交的时间(按天)趋势(按实际成交)
-
订单数在地图上的分布
订单读取及处理
读取数据
import pandas as pd
df = pd.read_csv('tmall_order_report.csv',encoding='gbk')
df.head()
处理数据
df.columns
'''
遇到问题没人解答?小编创建了一个Python学习交流QQ群:926207505
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
# 将字段名称中空格去掉,规范字段名称
df = df.rename( columns = {
'收货地址 ':'收货地址','订单付款时间 ':'订单付款时间'} )
df.columns
df.info()
重复值
df.duplicated().sum()
缺失值
df.isnull().sum()
# 订单付款时间 有2923个缺失值,属于正常现象,说明这些单位付过款,无需处理
订单转化率-漏斗图
计算每个环节的数据
-
将得到如下的数据:
[[‘总订单数’, ‘28010’],
[‘付款订单数’, ‘24087’],
[‘到款订单数’, ‘18955’],
[‘全额到款订单数’, ‘18441’]]
买家实际支付金额:总金额 - 退款金额(在已付款的情况下)。金额为0(在未付款的情况下)
退款金额:付款后申请退款的金额。如无付过款,退款金额为0
订单总笔数
dict_convs = dict()
key = '总订单数'
dict_convs[key] = len(df)
len(df)
付过款的订单数
'''
遇到问题没人解答?小编创建了一个Python学习交流QQ群:926207505
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
key = '付款订单数'
# 付款时间不为空的,表示付过款
df_payed = df[df['订单付款时间'