爬取ajax加载的豆瓣电影

本文介绍了如何爬取使用AJAX加载的豆瓣电影数据。通过分析JSON接口,发现数据按20条一组加载,并找到了URL的规律。尝试动态改变参数以获取更多数据,重点讨论了start参数的变化,并分享了完整代码实现。
摘要由CSDN通过智能技术生成

(一)前提:找到ajax异步加载的包接口,注意第一个电影名

 我们把Request URL网址复制到地址栏得到:

上图是json格式数据,且第一个电影一致,说明我们找到了正确的ajax的json接口

出现加载更多之前是20部电影,点击加载更多,我们会得到第二个json包,里面是另外20个电影。

 

(二)爬取豆瓣中美剧分类的电影200个第一种方式(最后优化):

多加载几个json接口,找url规律

对json接口找规律,for循环拿到各json数据的url接口进行访问,把需要内容存入txt

import requests

# url2 = "https://movie.douban.com/j/new_search_subjects?sort
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值