基于多种分隔符进行字符串的分割

首先来说,字符串尾部的不叫分隔符,字符串中间的才叫分隔符。
例如 Hello World, My name is Python. 中的点号就不是分隔符

将下面这个字符串切分成单个的单词。
Hello World, My name@ is Python

从上面这个例子中可以看出分隔符有逗号,多个空格,@这三种。下面给出两种解决办法。

方法1 String模块的spilt()
思路: 将除了空格以外的其他分隔符全部替换为空格,然后按照空格符进行分割。
str.replace('a', 'b') 表示用 b 替换掉 str 中的 a
str.split() 默认按照空格进行分割字符串str
str.split(',') 表示按照 , 进行分割字符串 str

>>> str = 'Hello World,   My name is Python.'
>>> str.replace(',','').replace('@','').split()
['Hello', 'World', 'My', 'name', 'is', 'Python']

方法2 re模块的spilt()

>>> import re
>>> str = 'Hello World,   My name@ is Python'
>>> re.split(r'[,@\s]\s*', str)
['Hello', 'World', 'My', 'name', 'is', 'Python']

正则表达式符号复习
- ? 匹配零次或一次前面的分组
- * 匹配零次或多次前面的分组
- + 匹配一次或多次前面的分组
- {n} 匹配 n 次前面的分组
- {n,} 匹配 n 次或更多次前面的分组
- {,m} 匹配零次到 m 次前面的分组
- {n,m} 匹配至少 n 次,至多 m 次前面的分组
- {n,m}?{n,m}*?{n,m}+? 对前面的分组进行非贪心匹配
- ^spam 表示字符串必须以 spam 开始
- spam$ 表示字符串必须以 spam 结束
- . 匹配所有字符,换行符除外
- \d\w\s 分别匹配数字、单词、空格
- \D\W\S 分别匹配除数字、单词、空格外的所有字符
- [abc] 表示匹配方括号内的任意字符(例如上面例子中的,, @,
- [^abc] 表示匹配不在方括号内的任意字符

总结
显然 String 对象的 split() 方法只适用于非常简单的字符串分割的场景,它并不允许有多个分隔符或者是分隔符周围不确定的空格(本例中的逗号后面有若干空格)。当需要更加灵活的切割字符串的时候,最好使用 re.split() 方法。

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

清风醉雨

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值