re正则表示式爬取网页

最新推荐文章于 2022-05-29 11:41:10 发布

ErrorMaker...

最新推荐文章于 2022-05-29 11:41:10 发布

阅读量101

点赞数

分类专栏：爬虫

本文链接：https://blog.csdn.net/qq_22667507/article/details/115180891

版权

爬虫专栏收录该内容

2 篇文章 0 订阅

订阅专栏

#爬取豆瓣短评
import requests
import re
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3676.400 QQBrowser/10.5.3738.400'}

url = 'https://book.douban.com/subject/1084336/comments/'
r = requests.get(url=url,headers = headers).text
pattern = '<span class="short">(.*?)</span>'
result = re.findall(pattern,r)
print(result)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

ErrorMaker...

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
re正则表示式爬取网页

#爬取豆瓣短评import requestsimport reheaders = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3676.400 QQBrowser/10.5.3738.400'}url = 'https://book.douban.com/subj
复制链接

扫一扫