使用正则替换掉<a></a>标签
import re
text = "aaa<a href=\"http://www.baidu.com\">这是第一个链接</a>bbbb<a href=\"https://blog.csdn.net\">这是第二个链接</a>cccc"
# 正则查找并替换
text = re.sub(re.compile(r"<a.*?</a>", re.S), "", text)
print(text)
打印结果:
aaabbbbcccc
使用正则查找匹配内容
import re
text = "aaa<a href=\"http://www.baidu.com\">这是第一个链接</a>bbbb<a href=\"https://blog.csdn.net\">这是第二个链接</a>cccc"
# 查看下匹配到什么
text = re.compile(r"<a.*?>(.*?)</a>").findall(text)
print(text)
打印结果:
['这是第一个链接', '这是第二个链接']