使用正则表达式爬取网页文本

榴莲味的电池

于 2019-07-15 18:20:26 发布

阅读量620

点赞数 1

本文链接：https://blog.csdn.net/qq_43115981/article/details/95998353

版权

字符串处理与替换

# coding = utf-8
import re

content = '''
<tr> <td> 1001 </td> <td> 杨秀璋<br /> </td> </tr>
<tr> <td> 1002 </td> <td> 颜 &nbsp;娜 </td> </tr>
<tr> <td> 1003 </td> <td> <B> Python </B> </td> </tr>
'''

res = r'<td>(.*?)</td><td>(.*?)</td>'
texts = re.findall(res,content,re.S|re.M)
for m in texts:
    print(m[0],m[1])

代码是基于python2.*
现在换了python3.*就得不到结果了
求问是三引号的问题还是正则表达式写法的问题？