爬取豆瓣电影的评论

最新推荐文章于 2024-04-13 07:32:25 发布

Sandy_Star

最新推荐文章于 2024-04-13 07:32:25 发布

阅读量1.5k

点赞数 2

文章标签： python

本文链接：https://blog.csdn.net/weixin_48931875/article/details/121496380

版权

好久没有爬虫了，今天突然叫爬豆瓣，有点懵了，不过看了看以前爬的，一葫芦画瓢整了一个这个。bs4和requests yyds！

分析一波

爬取的地址：https://movie.douban.com/subject/26588308/comments

每次翻页可以看到只和start有关，一页展示20条评论
下图是第二页的url，故第一页的start就是0

评论在span标签里面（class属性为short）

代码

import urllib.request
from bs4 import BeautifulSoup
import time

absolute = "https://movie.douban.com/subject/26588308/comments"
headers = {
   
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.71 Safari/537.36',
}
comment_list = []


#解析html
def get_data(html):
    soup

最低0.47元/天解锁文章

优惠劵

Sandy_Star

关注关注

2
点赞
踩
14

收藏

觉得还不错? 一键收藏
1
评论
爬取豆瓣电影的评论

好久没有爬虫了，今天突然叫爬豆瓣，有点懵了，不过看了看以前爬的，一葫芦画瓢整了一个这个。bs4和requests yyds！分析一波爬取的地址：https://movie.douban.com/subject/26588308/comments每次翻页可以看到只和start有关，一页展示20条评论下图是第二页的url，故第一页的start就是0评论在span标签里面（class属性为short）代码import urllib.requestfrom bs4 import .
复制链接

扫一扫