#设置bins,和分组名称
bins=[-10,7091,10952,17656,37556]
groups=[“较差”,“中等”,“较好”,“非常好”]
#使用cut分组
#sale_area[“分组”]=pd.cut(sale_area[“利润”],bins,labels=groups)
7、对比两列差异
因为这表每列数据维度都不一样,比较起来没啥意义,所以我先做了个订单明细号的差异再进行比较。
需求:比较订单明细号与订单明细号2的差异并显示出来。
sale[“订单明细号2”]=sale[“订单明细号”]
#在订单明细号2里前10个都+1.
sale[“订单明细号2”][1:10]=sale[“订单明细号2”][1:10]+1
#差异输出
result=sale.loc[sale[“订单明细号”].isin(sale[“订单明细号2”])==False]
8、异常值替换
首先用describe()函数简单查看一下数据有无异常值。
#可看到销项税有负数,一般不会有这种情况,视它为异常值。
sale.describe()
需求
用0代替异常值。
sale[“订单金额”]=sa