-
匹配字符串中的hashtags
import re
with open("text.txt", "r", encoding="utf-8") as fd:
data = fd.read()
pattern = re.compile(r'(#.*?\s+?)')
match = re.findall(pattern,data)
print(match[:10])
注意,*或+后面跟着?表示非贪婪匹配,意思是匹配到第一个符合条件的结尾即可。
-
匹配到TAB和空格的混合字符
可以使用下面的两个小技巧:
1). 使用\s来匹配
>>> import re
>>> match = re.match(r"Hello(\s*)(.*)World!", "Hello Python World!"
)
>>> match.groups()
('\t\t ', 'Python ')
>>>
2). 使用[\t ]来匹配
>>> import re
>&g