python数据清洗常见操作方法代码,导入表格

import pandas as pd
pd.set_option(‘display.unicode.ambiguous_as_wide’,True)
pd.set_option(‘display.unicode.east_asian_width’,True)#这两行对齐列名
pd.set_option(‘display.width’,180)#设置打印宽度///重要

##显示所有列

pd.set_option(‘display.max_columns’, None)

##显示所有行

pd.set_option(‘display.max_rows’, None)

df=pd.read_excel(“data/朝阳区药品销售数据.xlsx”)

print(df)

#数据清洗
#1.判断和处理空值 2.处理重复值, 3.处理异常值

print(pd.isnull(df).sum())#统计缺失值

print(pd.notnull(df).sum())#统计非缺失值

#删除

df.dropna(how=“all”,thresh=3)#thresh=3查值,空值超过3个才删除行或列

print(“原数据形状”,df.shape)

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值