1、英文中以cat开头的字符串:\bcat\w*
来匹配所有以"cat"开头的单词。\b
表示单词的边界,\w*
表示零个或多个字母、数字或下划线字符
import re
# 在文本中查找所有以"cat"开头的单词
text = "The cat in the hat sat on the mat."
pattern = r"\bcat\w*"
matches = re.findall(pattern, text)
print(matches)
2、中文中以“省”结尾的字符串:.*
表示匹配前面的任意字符零次或多次,'省'
表示匹配’省’字符,而'$'
表示匹配字符串的末尾位置,re.MULTILINE
标志可以指定在多行文本中查找匹配项。
import re
# 在中文文本中查找以'省'结尾的字符串
text = "北京市 海淀区 上地街道 海淀大街27号 东升科技园B座21层,邮编100083。"
pattern = r".*省$"
matches = re.findall(pattern, text, re.MULTILINE)
print(matches)