python Series 添加行_傻傻分不清系列 | Python中各种字符串处理方法

本文介绍了Python Pandas中的字符串处理方法,与Python内建函数的相似性和差异,并通过实例展示了Pandas字符串方法的高效性和简洁性。包括向量化操作、取值切片、字符串拼接、字符替换以及独热编码等,揭示在大量文本数据处理时,Pandas字符串方法的优势。
摘要由CSDN通过智能技术生成

Python易混淆知识系列:Pandas字符串方法和字符串内建函数,使用Python的一个优势就是字符串处理起来比较容易。

Python的初学者在学习字符串内建函数的时候往往会很困惑:字符串的内建函数是对单个字符串对象处理,如果要对成千上万个字符串对象处理该怎么办?

不少已经使用Python工作很长时间的同学,即使已经学会使用Pandas对象的.apply()方法来处理字符串,依然会时常忘记:其实Pandas已经自带功能强大的向量化字符串操作。

即使知道Pandas字符串方法的同学,使用的时候也经常与字符串内建函数混淆。

而熟练使用Pandas字符串方法的同学往往会觉得,其方法的代码简洁性与运行效率都远高于其他的写法。真相到底如何?Pandas字符串方法和字符串内建函数有什么不同?运算效率真的像传闻那么高吗?

今天我们就好好捋一下这块Python易混淆的知识点。

1. 快速入门向量化字符串操作

初学Python字符串内建函数的同学肯定知道有个叫.lower()的方法可以将字符串中的大写英文字母转化为小写,比如将字符串对象’ABCD’转化为小写:

9df949db2765fc6a9c2a93e29cc5a546.png

点击添加图片描述(最多60个字)编辑

如果字符型的Series对象中的字符串要转化为小写呢?比如:

dd578e477d84a134b566894c635e2ba9.png

点击添加图片描述(最多60个字)编辑

此时,我们就可以使用Series的str方法中的.lower()来处理:

0cb7072906d81f2e87cf2a665ab3c616.png

点击添加图片描述(最多60个字)编辑

同理,如果要将Series对象中的所有的大写字母变成小写,可以使用.str.upper()。

看到这里,相信很多没有使用过Pandas字符串方法的同学会惊奇地发现,这跟字符串对象的内建函数差不多呀?只不过多了一个通过.str()方法调用函数的过程。

确实,大多数Pandas的字符串方法借鉴了Python字符串内建函数的内容,这里给大家梳理一下,两种处理字符串方法基本相同的地方:

· 求字符串长度

§ .str.len()

· 字符检索

§ .str.find()和.str.rfind()

§ .str.index()和.str.rindex()

· 字符转换

§ .str.lower()和.str.upper()

§ .str.title()和.str.capitalize()

§ .str.swapcase()

· 字符类型判断

§ .str.islowe

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值