pandas 字符串切片后保存_pandas的分列之不规则字符串及str.extract()

本文介绍了如何使用pandas对不规则字符串进行处理,包括通过str切片去除前缀,以及利用str.extract和正则表达式提取数字和字母。在面对数字和字母混合的字符串时,str.extract能有效提取所需部分,但提取后的数据需转换为数值格式才能进行计算。
摘要由CSDN通过智能技术生成

在上一篇文章中,我们总结了分列的一种方式:当所有行在需要的分列的地方都是相同的字母、符号、空格等等的时候,我们可以使用str.split()直接将所有行分成两列。

然而在实际工作中,有可能有并不是所有的行都有用于分列的键。今天再总结两种:

format,png

数据源

上面这组数据中的Latitude是我们需要分列的列。每个数据中都有前缀ab,这是我们不需要的。我们要做的是从第三位开始将订单号切下来,就像对字符串进行的切片操作一样。

format,png

用str函数进行切片

很简单吧,先使用.str将‘Latitude‘这一列转换为类似字符串数据类型,然后再用[ ]切片器就行了。跟字符串一样,切片器可以切前面、后面、中间任一位置。

format,png

切片1

format,png

切片2</

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值