requests爬取微博

最新推荐文章于 2024-03-18 15:12:16 发布

__顾影自怜

最新推荐文章于 2024-03-18 15:12:16 发布

阅读量2.4k

点赞数 1

分类专栏： requests

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/a2639491403/article/details/81348059

版权

本文介绍了如何利用requests和pyquery库爬取蒋方舟微博的内容。通过分析URL发现只需改变page参数即可翻页，通过观察json数据结构，找到了包含所需信息的部分。使用requests的params方法构造URL，同时设置headers以模拟浏览器行为，防止被识别为爬虫。最后展示了完整的爬虫代码，用于获取微博的id、内容、点赞数、回复数和转发数。

摘要由CSDN通过智能技术生成

微博地址：蒋方舟微博

用到技术：requests+pyquery

分析页面

通过对比url发现，似乎只需要改变page就能完成翻页

尝试把page=3放上去得到了如下内容,json序列化

点开调试工具的preview就能看到json反序列化

最低0.47元/天解锁文章

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

__顾影自怜 CSDN认证博客专家 CSDN认证企业博客

码龄7年

39: 原创

24万+: 周排名

39万+: 总排名

10万+: 访问

: 等级

1030: 积分

26: 粉丝

30: 获赞

9: 评论

113: 收藏

私信

关注

热门文章

分类专栏

转载笔记 3篇
个人 11篇
hive 2篇
spark 1篇
linux基础 1篇
hadoop 2篇
mysql 1篇
flume 3篇
kafka 2篇
scrapy 3篇
requests 3篇

最新评论

python 第一天
2401_8308552: 讲的仔细，适合“新手入门知识”。
在spark中将数据插入HIVE表
AhLe丶: 这一堆错别字真的极品
kafka安装及使用
秃秃的程序猿: 挺详细，适合新手，谢谢大佬！！！
在spark中将数据插入HIVE表
罗密欧V1: 将集群或者你要写入的hive的配置文件中的hive-site.xml 复制到工程目录resources下然后初始话sparksession的时候，加上.enableHiveSupport() 例如[code=plain] val spark = SparkSession.builder().appName("sqlInsert") .master("local[*]").enableHiveSupport().getOrCreate() [/code]
在spark中将数据插入HIVE表
1818科研分队: 你好，想问你一下，spark怎么连hive？没看到连hive的操作。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。