关于爬取豆瓣网几页数据将其以列表的形式输出

意(づ ●─● )づ

已于 2024-06-10 13:53:16 修改

阅读量538

点赞数 8

文章标签： python

于 2024-06-10 13:47:57 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_81897189/article/details/139576059

版权

本文介绍如何使用PyCharm进行Python爬虫，通过安装jsonpath库，爬取豆瓣电影Top250的电影标题。从指定起始页到结束页，每页电影名以列表形式输出，涉及的步骤包括请求、内容获取和解析。

摘要由CSDN通过智能技术生成

关系PyCharm爬取豆瓣网几页数据时，我们要用列表输出时要注意我们一定要安装完jsonpath库，如果没安装请用命令安装pip install jsonpath，或者直接点settings，找到python interpreter再点击＂＋＂，搜索关键字进行安装。我们要用函数

import urllib.parse

import urllib.request

import json

import jsonpath

def create_request(page):

base_url = 'https://movie.douban.com/j/chart/top_list?type=5&interval_id=100%3A90&action=&'

data = {

'start': (page - 1) * 20,

'limit': 20,

'pn': 2

}

data = urllib.parse.urlencode(data)

url = base_url + data

print(url)

headers = {

'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/123.0.0.0 Safari/537.36 Edg/123.0.0.0'

}

reques

最低0.47元/天解锁文章

意(づ ●─● )づ

关注

8
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
关于爬取豆瓣网几页数据将其以列表的形式输出

关系PyCharm爬取豆瓣网几页数据时，我们要用列表输出时要注意我们一定要安装完jsonpath库，如果没安装请用命令安装pip install jsonpath，或者直接点settings，找到python interpreter再点击＂＋＂，搜索关键字进行安装。start_page = int(input('请输入起始的页码'))end_page = int(input('请输入结束的页码'))# print(url) # 注释掉这一行，不输出网址。
复制链接

扫一扫

意(づ ●─● )づ CSDN认证博客专家 CSDN认证企业博客

码龄1年

3: 原创

171万+: 周排名

16万+: 总排名

1970: 访问

: 等级

83: 积分

37: 粉丝

51: 获赞

4: 评论

44: 收藏

私信

关注

热门文章

最新评论

关于爬取豆瓣网几页数据将其以列表的形式输出
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
MapReduce以及WordCount案例
CSDN-Ada助手: 很棒的博客！MapReduce以及WordCount案例确实是一个很有趣的主题，而你对于并行计算与软件框架的介绍也很详细。希望你能继续分享更多关于这方面的知识和经验，让更多人了解并学习。另外，在使用MapReduce时，可以考虑使用Combiner来减少数据传输量，提高作业的效率。希望这个小技巧对你有所帮助！期待你的下一篇博文！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
HDFS基准测试Hadoop3.1.3
意(づ ●─● )づ: 这个修改文化需要在三台都执行
HDFS基准测试Hadoop3.1.3
CSDN-Ada助手: 恭喜你开始了博客创作的第一步！标题看起来很专业啊，对HDFS基准测试的探索一定很有深度。希望你能继续分享更多关于Hadoop3.1.3的经验和见解，或许可以尝试分析一些实际案例或者与其他版本的比较，让读者更全面地了解这个领域。加油！期待你的更多精彩内容！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。