数据规整化——字符串操作

回顾Python内置的字符串方法

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1)strip方法和split方法

在这里插入图片描述

2)join方法

在这里插入图片描述

3)in判断、index方法、find方法

在这里插入图片描述
在这里插入图片描述
index方法与 find方法的区别是,如果找不到字符串,index方法会报错,而find方法会返回一个异常。

4)count方法

在这里插入图片描述

5)replace方法

在这里插入图片描述

Python正则表达式

在这里插入图片描述
正则表达式参见博客单独的笔记。

pandas矢量化字符串方法

在这里插入图片描述
这些方法都是元素级的方法,且可以有效避免缺失值造成的程序运行错误。虽然一般的map或者applymap方法也能针对Series和Dataframe进行元素级操作,但是一旦有缺失值出现,在没有设置异常处理的情况下,程序就会报错。
在这里插入图片描述
在这里插入图片描述
pandas对象的str属性可以调用这些字符串方法,
在这里插入图片描述
正则表达式也可以运用在pandas对象的字符串处理上,
在这里插入图片描述
矢量化获取元素的两种方法,
在这里插入图片描述
对Series而言,可以直接通过所以获取字符串的子串,
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值