整理了一下re匹配特定字符串的代码。
# 加载库
import re
# 提取 ' '、" "、( )、[ ]、{ } 以及 < > 等里面的内容
# 输入 "href='www.baidu.com'"
# 输出 ['www.baidu.com']
# 输入 "href='www.baidu.com', href='www.momo.com', href='www.tantan.com'"
# 输出 ['www.baidu.com', 'www.momo.com', 'www.tantan.com']
提取 ' '
内容
# 匹配一个
text = "href='www.baidu.com'"
# 用 (.+) 匹配所需内容
re.findall("href='(.+)'",text)
# ['www.baidu.com']
# 匹配多个
text = "href='www.baidu.com', href='www.momo.com', href='www.tantan.com'"
# 用 (.+?) 匹配所需内容
re.findall("href='(.+?)'",text)
# ['www.baidu.com', 'www.momo.com', 'www.tantan.com']
提取 " "
内容
# 匹配一个
text = 'href="www.baidu.com"'
# 用 (.+) 匹配所需内容
re.findall('href="(.+)"',text)
# ['www.baidu.com']
# 匹配多个
text = 'href="www.baidu.com", href="www.momo.com", href="www.tantan.com"'
# 用 (.+?) 匹配所需内容
re.findall('href="(.+?)"',text)
# ['www.baidu.com', 'www.momo.com', 'www.tantan.com']
提取 ( )
内容
# 匹配一个
text = "This is (my) uncle."
# 用 [(](.+)[)] 匹配所需内容
re.findall("[(](.+)[)]",text)
# ['my']
# 匹配多个
text = "This is (my) (uncle)."
# 用 [(](.+?)[)] 匹配所需内容
re.findall("[(](.+?)[)]",text)
# ['my', 'uncle']
提取 [ ]
内容
# 匹配一个
text = "This is [my] uncle."
# 用 \[(.+)\] 匹配所需内容
re.findall("\[(.+)\]",text)
# ['my']
# 匹配多个
text = "This is [my] [uncle]."
# 用 \[(.+?)\] 匹配所需内容
re.findall("\[(.+?)\]",text)
# ['my', 'uncle']
提取 { }
内容
# 匹配一个
text = "This is {my} uncle."
# 用 {(.+)} 匹配所需内容
re.findall("{(.+)}",text)
# ['my']
# 匹配多个
text = "This is {my} {uncle}."
# 用 {(.+?)} 匹配所需内容
re.findall("{(.+?)}",text)
# ['my', 'uncle']
提取 < >
内容
# 匹配一个
text = "This is <my> uncle."
# 用 <(.+)> 匹配所需内容
re.findall("<(.+)>",text)
# ['my']
# 匹配多个
text = "This is <my> <uncle>."
# 用 <(.+?)> 匹配所需内容
re.findall("<(.+?)>",text)
# ['my', 'uncle']