解决：python爬取豆瓣电影遇到的KeyError: 'subject_collection_items'错误

最新推荐文章于 2024-01-10 11:08:53 发布

昆昆欧粑粑

最新推荐文章于 2024-01-10 11:08:53 发布

阅读量3.3k

点赞数 3

分类专栏： python 文章标签： KeyError 爬虫豆瓣 python

本文链接：https://blog.csdn.net/likunkun__/article/details/89323202

版权

在爬取豆瓣电影'正在热映'页面的JSON数据时，遇到KeyError: 'subject_collection_items'的问题。通过分析请求URL和使用start参数定位页面，原本预期数据位于该键下，但实际请求返回的字典中并未包含。为解决此问题，发现浏览器请求时包含了'Referer'头信息，将其添加到代码的headers中，成功获取数据。

摘要由CSDN通过智能技术生成

今天在学习爬虫，爬取豆瓣电影的一些json资料存到本地的时候遇到了一些问题，先解释一下：

在豆瓣手机版的“正在热映”页面里可以找到一些包，里面有当前页的内容（json格式）：

所以requests模块可以去爬这些下来：

找到url，然后找到提交规律url里是用的start来表示当前页面显示的是哪些片。

还可以找到数据都放在subject_collection_items下面：

于是写了代码如下：

import requests
import json

class Douban:
    def __init__(self):
        self.url_temps = [
            'https://m.douban.com/rexxar/api/v2/subject_collection/movie_showing/items?start

最低0.47元/天解锁文章

昆昆欧粑粑

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
5
评论
解决：python爬取豆瓣电影遇到的KeyError: 'subject_collection_items'错误

今天在学习爬虫，爬取豆瓣电影的一些json资料存到本地的时候遇到了一些问题，先解释一下：在豆瓣手机版的“正在热映”页面里可以找到一些包，里面有当前页的内容（json格式）：所以requests模块可以去爬这些下来：找到url，然后找到提交规律url里是用的start来表示当前页面显示的是哪些片。还可以找到数据都放在subject_collection_items下面：...
复制链接

扫一扫

专栏目录