Python - Pandas 数据排序与字符串处理

本文摘要:

见下图,排序的方法很显而易见,不作演示。
在这里插入图片描述
在这里插入图片描述
字符串处理参考文档

Series的str属性

# 获取Series的str属性
df['bWendy'].str

查看返回对象,如下图所示
在这里插入图片描述

# 字符串替换,将字符串中的°C去掉,返回Series对象
df['bWendy'].str.replace('°C', '')
# 查看字符串长度,方法与Python字符串大多相似
df['bWendy'].str.len()

使用str的startswith、contains等返回bool的Series做条件查询

condition = df['date'].str.startswith('2022-03')
# 返回bool类型的Series

多次str处理的链式操作

假设有日期列date,日期格式为YYYY-MM-DD,欲提取字符串为YYYYMM,需做如下操作:
1.将 ‘-’ 去掉
2.切片
由于都是基于字符串的操作,而每次方法调用后返回的是Series对象,所以需要再次获取str属性,否则会报错。

df['date'].str.replace('-', '').str.slice(0,6)
# 或者
df['date'].str.replace('-', '').str[0:6]

使用正则表达式处理

Series.str默认有正则表达式模式
假设日期格式为YYYY年MM月DD日,欲去除年月日三个字

# 方法一
df[date].str.replace('年', '').str.replace('月', '').str.replace('日', '')

# 方法二,字符串匹配只要遇到年/月/日就替换为空,即去除
df[date].str.replace('[年月日]', '')

*此文仅为个人笔记

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值