物流数据分析

这篇博客主要介绍了物流数据分析的过程,包括数据清洗、重复值处理、缺失值处理、格式调整、异常值处理和数据分组。使用Python的pandas库,对订单数据进行了详细的操作,如删除重复和空值行,将金额单位统一,处理异常值,计算交货率和各种反馈率。最后,通过排序展示了不同区域的退货率、返修率和合格率。
摘要由CSDN通过智能技术生成
import pandas as pd
import numpy as np
data = pd.read('',encodings='gbk')#gbk中文显示
print(data.info())#查看数据信息

#1数据清洗
#整列空值的,或某行有一个以上的空值

#重复值
data = data.duplicates(keep = 'frist',inplace = True)#删除重复数据,keep第一行,true且为替换原数据
#缺失值
data.dropna(axis = 0,how = 'any')#axis =0 删除行,how=any#表示存在一个就删除整行,若为all则全部空才删除
#删除整行
data.drop(columns = ['订单行'],inplace = True)#若删除后再运行会报错,
#删除数据之后index索引列混乱,需要更新index
data = data.reset_index(drop=True,inplace=True)#drop=True删除原索引,并重置

#格式调整(金额单位不一致(万元,元,无单位。。。),
# 且有错误符号(小数位是逗号,要改成点),数据类型要是int、float才能计算)
#先定义处理函数
def data_deal(number):
    if number.find('万元') !=-1:#找到带万元的金额
        float(number[:number.find('万元')].replace(',','.'))*10000
        #number[:number.find('万元')]#number切片,从开头,取到找到
物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历史货量数据集物流网络历
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值