python爬取豆瓣电影top250_python3爬取豆瓣top250电影

最新推荐文章于 2023-11-07 14:00:48 发布

weixin_39738251

最新推荐文章于 2023-11-07 14:00:48 发布

阅读量1.1k

点赞数

文章标签： python爬取豆瓣电影top250

需求：爬取豆瓣电影top250的排名、电影名称、评分、评论人数和一句话影评

环境：python3.6.5

准备工作：

豆瓣电影top250（第1页）网址：https://movie.douban.com/top250?start=0 或者 https://movie.douban.com/top250

每页展示25个电影，一共10张翻页

第2页：https://movie.douban.com/top250?start=25&filter=

第3页：https://movie.douban.com/top250?start=50&filter=

……

最后一页：https://movie.douban.com/top250?start=225&filter=

由此可见，除了首页代码其他9页（相对首页增加了一些字符串）以25递增

查看每页的html代码：

在浏览器空白区域点击“查看源代码”（不同的浏览器可能起的名字不一样），找到所需要的内容。

快速定位html有效信息的方法：

例如排名第一的电影是《肖申克的救赎》，在html源码中搜索（ctrl+F）这个名字（不要加书名号），快速定位大致位置，如下图

仔细研究html代码：

所有影片存放在ol列表中，每一部影片在一个li中，需要提取的信息在不同的标签中，如下图所示

代码逻辑为：查找ol→li→各个标签

需要用到的第三方库：

最低0.47元/天解锁文章

weixin_39738251

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python爬取豆瓣电影top250_python3爬取豆瓣top250电影

需求：爬取豆瓣电影top250的排名、电影名称、评分、评论人数和一句话影评环境：python3.6.5准备工作：豆瓣电影top250（第1页）网址：https://movie.douban.com/top250?start=0 或者 https://movie.douban.com/top250每页展示25个电影，一共10张翻页第2页：https://movie.douban...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。