Python 正则表达式爬取浏览目录

最新推荐文章于 2022-06-18 23:35:34 发布

weixin_34194317

最新推荐文章于 2022-06-18 23:35:34 发布

阅读量92

点赞数

文章标签： python

原文链接：http://www.cnblogs.com/Hunter-541695/p/9588602.html

版权

 1 import requests
 2 import re
 3 
 4 content = requests.get('https://book.douban.com/').text
 5 pattem = re.compile('<li.*?cover.*?title="(.*?)".*?href="(.*?)".*?more-meta.*?author">(.*?)</span>.*?year">(.*?)</span>.*?</li>',re.S)
 6 results = re.findall(pattem, content)
 7 # print(results)
 8 
 9 for result in results:
10     name,url,author,date = result
11     author = re.sub('\s','',author)
12     date = re.sub('\s','',date)
13     print(url,name,author,date)

转载于:https://www.cnblogs.com/Hunter-541695/p/9588602.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_34194317

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python 正则表达式爬取浏览目录

1 import requests 2 import re 3 4 content = requests.get('https://book.douban.com/').text 5 pattem = re.compile('<li.*?cover.*?title="(.*?)".*?href="(.*?)".*?more-meta.*?author">(.*?...
复制链接

扫一扫