Pandas数据清洗时的常用函数,叼爆了呀!

六边形战士,你知道的越多,不知道的越多!

pands进阶使用来了,让你的数据清洗快人一步,Let‘s go !

在这里插入图片描述

今天用到的库是:os(???),pandas

from os import sep
import pandas as pd

0.导数

data ={'name':[' 黄同学','黄至尊','黄老邪 ','陈大美','孙尚香'],
     'en_name':['Huang tong_xue','huang zhi_zun','Huang Lao_xie','Chen Da_mei','sun shang_xiang'],
     'sex':['男','women','men','女','男'],
     'idcard':['463895200003128433','429475199912122345','420934199110102311','431085200005230122','420953199509082345'],
     'height':['mid:175_good','low:165_bad','low:159_bad','high:180_verygood','low:172_bad'],
     'address':['湖北广水','河南信阳','广西桂林','湖北孝感','广东广州'],
     'phone':['13434813546','19748672895','16728613064','14561586431','19384683910'],
     'salary':['1.1万','8.5千','0.9万','6.5千','2.0万']}

df=pd.DataFrame(data)
print(df)

1.cat :连接

df2=df['name'].str.cat(df['address'],sep='---')
print(df2)

在这里插入图片描述

2.contains:是否包含

df3=df['address'].str.contains("湖北")
print(df3)

在这里插入图片描述

3.count:统计频数

df4=df['phone'].str.count("1")
print(df4)

在这里插入图片描述

4.slice_replace:切片替换

df5=df['phone'].str.slice_replace(3,7,"****")
print(df5)

在这里插入图片描述

5.split+expand:分割并铺开

df[['last_name','first_name']]=df['en_name'].str.split(" ",expand=True)
print(df.head(1))

# 补充:startswith/endswitch/get/len/upper/lower/replace/strip/findall/extract

在这里插入图片描述


在这里插入图片描述

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

道-闇影

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值