python pandas str列内置方法

本文介绍了如何利用Pandas DataFrame的str列内置方法处理字符串数据,包括独热编码、切分、替换、正则表达式匹配、长度计算、空白字符处理以及字母数字属性检查等操作。
摘要由CSDN通过智能技术生成

    pandas的DataFrame,有时需要处理一些字符串类型列,运用Series.str列内置方法很方便。

1.one hot 独热编码,get_dummies

series=data['列名'].str.get_dummies(sep=',')

实现DataFrame中列有多值,且想把这列one hot下

2.切分字符串,split()

series=data['列名'].str.split(',')

把DataFrame列中字符串以','分隔开,每个元素分开后存入一个列表里

series=data['列名'].str.split(',',expand=True)

参数expand,这个参数取True时,会把切割出来的内容当做一列,产生多列。

series=data['列名'].str.split(',',expand=True)[0]

可以只要第一列。

3.替换,replace()

series=data['列名'].str.replace(',','-')

用‘-’代替‘,’

4.是否包含表达式,contains()

series=data['列名'].str.contains('we')

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值