爬取豆瓣电影（ajax）

最新推荐文章于 2021-08-19 21:07:21 发布

夏了夏天int

最新推荐文章于 2021-08-19 21:07:21 发布

阅读量198

点赞数

分类专栏： Python爬虫文章标签： python

本文链接：https://blog.csdn.net/weixin_45827387/article/details/114706961

版权

Python爬虫专栏收录该内容

9 篇文章 0 订阅

订阅专栏

抓取加载页面，分析url

每刷新一次url的page_start=0,20,40，…

import requests
from fake_useragent import UserAgent
def getInfo(page):
    baseurl = r'https://movie.douban.com/j/search_subjects?type=movie&tag=%E7%83%AD%E9%97%A8&sort=recommend&page_limit=20&page_start='
    headers = {
        'User-Agent': UserAgent().random
    }
    respones = requests.get(baseurl+str(page), headers=headers)
    return respones
 if __name__ == '__main__':
    for i in range(10):
     	 respones = getInfo(i*20)

利用json解析出电影名称

在这里插入图片描述
完整代码

import requests
from fake_useragent import UserAgent
import json


def getInfo(page):
    baseurl = r'https://movie.douban.com/j/search_subjects?type=movie&tag=%E7%83%AD%E9%97%A8&sort=recommend&page_limit=20&page_start='
    headers = {
        'User-Agent': UserAgent().random
    }
    respones = requests.get(baseurl+str(page), headers=headers)
    return respones


if __name__ == '__main__':
    for i in range(10):
        respones = getInfo(i*20)
        data=json.loads(respones.text)
        for j in range(20):
            print(data['subjects'][j]['title'])

在这里插入图片描述

夏了夏天int

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬取豆瓣电影（ajax）

抓取加载页面，分析url每刷新一次url的page_start=0,20,40，…import requestsfrom fake_useragent import UserAgentdef getInfo(page): baseurl = r'https://movie.douban.com/j/search_subjects?type=movie&tag=%E7%83%AD%E9%97%A8&sort=recommend&page_limit=20&p
复制链接

扫一扫

专栏目录