1. 读入数据并查看
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# 配置中文显示
plt.rcParams['font.sans-serif']='KaiTi'
plt.rcParams['axes.unicode_minus']=False
通过上面对数据的查看,可以看出:
(1)数据一共1161行,10列;
(2)订单号、货品交货状况和数量存在缺失值,但是缺失值个数不大,可以考虑删除;
(3)销售金额列数据格式不统一,无法进行运算,需要进行处理
2.数据清洗
2.1 删除重复记录
2.2 删除缺失值
2.3 处理格式不统一的列:销售金额
2.4 异常值处理
去除销售金额为0的记录
2.5 去除货品交货状况首尾空格
3. 数据分析与可视化
3.1 每月交货状况分析
3.2 不同地区的交货状况分析
3.3 不同商品的交货情况
3.4 不同销售区域不同商品的交货情况