extract()用法

extract() 是 Pandas 中字符串处理功能的一部分,用于从字符串中提取匹配的子字符串。

以下是 extract() 方法的一般用法:

Series.str.extract(pat, flags=0, expand=True)
  • Series:表示要操作的 Series 对象,通常是 DataFrame 中的某一列或单独的 Series。
  • pat:表示正则表达式模式或命名分组的模式。用于指定要提取的子字符串的模式。
  • flags:可选参数,用于指定正则表达式的标志。例如,re.IGNORECASE 表示忽略大小写。
  • expand:可选参数,默认为 True。表示是否将提取的结果展开为 DataFrame。如果为 True,则返回 DataFrame;如果为 False,则返回 Series。

extract() 方法会根据指定的模式在每个字符串中查找匹配的子字符串,并将其提取出来。提取的结果可以是单个字符串或多个字符串(如果有多个命名分组)。

import pandas as pd

data = {'Name': ['Smith, John Mr.', 'Johnson, Mary Mrs.', 'Doe, Jane Miss.']}
df = pd.DataFrame(data)

# 使用正则表达式提取称号
titles = df['Name'].str.extract('([A-Za-z]+)\.', expand=False)

print(titles)

输出结果:

0      Mr
1     Mrs
2    Miss
Name: Name, dtype: object

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值