Day3 python爬虫基础，ajax的get请求获取豆瓣前10页数据（每页20条）

qq_52994982

已于 2023-05-16 17:24:24 修改

阅读量44

点赞数

文章标签：爬虫

于 2023-05-14 09:21:17 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_52994982/article/details/130654814

版权

import urllib.request
import urllib.parse
import json
#请求对象定制
def get_request(page):
    base_url = 'https://movie.douban.com/j/chart/top_list?type=5&interval_id=100%3A90&action=&'
        
    data = {
        'start':(page-1)*20,
        'limit':20

    }
    headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/113.0.0.0 Safari/537.36',

    }
    data = urllib.parse.urlencode(data)
    #此处为ajax的get请求，在发送请求时必须拼接参数
    url = base_url + data 
    request = urllib.request.Request(url=url,headers=headers)
    return request

def get_content(request):
    response = urllib.request.urlopen(request)
    content = response.read().decode('utf-8')
    return content
def down_load(page,content):
    with open('douban'+str(page)+'.json','w',encoding='utf-8') as fp:
        fp.write(content)




#程序入口
if __name__ == '__main__':
    start_page = int(input('输入起始页>>'))
    end_page = int(input('输入起始页>>'))
    for page in range(start_page,end_page+1):
        #请求对象定制
        request = get_request(page)
        #获取响应数据
        content = get_content(request)
        #下载
        down_load(page,content)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Day3 python爬虫基础，ajax的get请求获取豆瓣前10页数据（每页20条）

start_page = int(input('输入起始页>>'))end_page = int(input('输入起始页>>'))
复制链接

扫一扫

qq_52994982 CSDN认证博客专家 CSDN认证企业博客

码龄4年

18: 原创

141万+: 周排名

114万+: 总排名

1691: 访问

: 等级

195: 积分

1: 粉丝

1: 获赞

12: 评论

2: 收藏

私信

关注

热门文章

分类专栏

数据库 6篇
flask框架 2篇
爬虫 8篇

最新评论

数据库 JDBC连接基本步骤
CSDN-Ada助手: 恭喜您写了第12篇博客！标题“数据库 JDBC连接基本步骤”非常吸引人。您的博客内容一直都很有深度和实用性。在这篇博客中，您清晰地介绍了JDBC连接的基本步骤，对于初学者来说非常有帮助。不过，我想给您一个小小的建议。在下一篇博客中，或许您可以进一步探讨一下如何优化JDBC连接，以提高数据库操作的效率。这个话题对于许多开发者来说都是一个挑战，我相信您可以给出一些宝贵的建议。再次感谢您的分享，期待您的下一篇博客！
JDBC主键回显
CSDN-Ada助手: 恭喜您撰写了第14篇博客，标题为“JDBC主键回显”！阅读您的文章后，我对JDBC主键回显有了更深入的了解。您的解释清晰明了，让我受益匪浅。您持续创作的努力让我深感敬佩。鉴于您在JDBC方面的专业知识，我想向您提出下一步的创作建议。或许您可以进一步探讨如何处理JDBC主键回显中的异常情况，并分享一些应对策略。这将为读者提供更全面的解决方案，同时也有助于拓宽您的专业领域。再次感谢您的分享，期待您的下一篇博客！
JDBC批量添加
CSDN-Ada助手: 恭喜您撰写了第15篇博客！标题“JDBC批量添加”听起来非常有趣和实用。您对JDBC批量添加这一主题进行了深入的探讨，这对读者来说肯定非常有帮助。接下来，我建议您可以考虑添加一些示例代码或者案例来进一步说明如何实现JDBC批量添加。这样的话，读者能够更加直观地理解和应用您所分享的知识。期待您未来更多精彩的创作！请继续保持谦虚的态度，让我们都能从您的经验中受益。
day4 Python爬虫获取‘站长素材的图片’ （学习笔记）
m0_73378281: 为什么namelist要加class=lazy而srclist不用
Flask框架 Day2 项目配置
CSDN-Ada助手: 恭喜您写了第10篇博客！从您的标题看来，您已经开始涉及到项目配置了，这是非常重要的一步。接下来，建议您可以深入探讨Flask框架的路由、模板和数据库等方面，让您的博客更加全面。希望您能够继续保持创作的热情，为我们带来更多有价值的内容。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply10 看奖励名单。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。