python表格数据洗掉百分号_Python高阶操作--关于数据清洗

最新推荐文章于 2022-07-16 16:10:12 发布

weixin_39713538

最新推荐文章于 2022-07-16 16:10:12 发布

阅读量1.2k

点赞数

文章标签： python表格数据洗掉百分号

基于pandas的数据清洗：

处理空值操作：

isnull ：df.isnull()--检测出原始数据中哪些行中存在空值

notnull：

any：可以帮助我们检测df中哪些行列中存在空值，必须配合isnull使用：isnull->any(axis=1)

all：也可以帮助我们检测元数据中哪些行列中存在空···值，必须配合notnull使用：notnull->all(axis=1)

dropna：删除元数据中存在空值的行数据：df.dropna(axis=0)：注意在drop函数中，0表示的是行，1表示的是列，与原生行列相反

fillna：覆盖元数据中存在的空数据，必须配合axis使用。

df.fillna(method='bfill',axis=0) #使用紧邻值填充空值

df.fillna(method='ffill',axis=1) #使用紧邻值填充空值

处理重复操作：drop_duplicates

df.drop_duplicates(keep='first')：保留第一个重复的数据

df.drop_duplicates(keep='last')：保留最后一个重复的数据

df.drop_duplicates(keep=False)：全部删除

处理异常数据：

df.drop(labels=xxxx):直接删除异常数据

级联操作：级联是对表格做拼接

匹配级联：

pd.concat((df1,df1,df1),axis=1)：三张表按照列进行级联

pd.concat与np.concatenate函数类似，只是多了一些参数：

objs

axis=0

keys

join='outer' / 'inner':表示的是级联的方式，outer会将所有的项进行级联(忽略匹配和不匹配)，而inner只会将匹配的项级联到一起，不匹配的不级联

ignore_index=False

pd

最低0.47元/天解锁文章

weixin_39713538

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python表格数据洗掉百分号_Python高阶操作--关于数据清洗

基于pandas的数据清洗：处理空值操作：isnull ：df.isnull()--检测出原始数据中哪些行中存在空值notnull：any：可以帮助我们检测df中哪些行列中存在空值，必须配合isnull使用：isnull->any(axis=1)all：也可以帮助我们检测元数据中哪些行列中存在空···值，必须配合notnull使用：notnull->all(axis=1)dropna：...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。