【Python】Python正则表达式速查表

本文介绍了Python中正则表达式的使用,包括如何匹配 hashtags、TAB和空格的混合字符,以及使用s和[ ]进行匹配。还讨论了字符串查找函数find(),以及re模块的match()、search()、findall()和sub()函数的区别。同时提到了正则表达式的贪婪与非贪婪匹配,以及如何处理反斜杠的困扰,推荐使用Python的原生字符串来简化表示。
摘要由CSDN通过智能技术生成

 


  •  匹配字符串中的hashtags

import re
with open("text.txt", "r", encoding="utf-8") as fd:
    data = fd.read()

pattern = re.compile(r'(#.*?\s+?)')
match = re.findall(pattern,data)
print(match[:10])

注意,*或+后面跟着?表示非贪婪匹配,意思是匹配到第一个符合条件的结尾即可。


  • 匹配到TAB和空格的混合字符

可以使用下面的两个小技巧:

1). 使用\s来匹配

>>> import re
>>> match = re.match(r"Hello(\s*)(.*)World!", "Hello              Python World!"
)
>>> match.groups()
('\t\t  ', 'Python ')
>>>
2). 使用[\t ]来匹配

>>> import re
>&g

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值