python3 scrapy抓取今日头条视频（西瓜视频）

最新推荐文章于 2024-07-21 18:03:04 发布

xudailong_blog

最新推荐文章于 2024-07-21 18:03:04 发布

阅读量1.2w

点赞数 2

分类专栏： # python3爬虫 # scrapy 文章标签： python 爬取头条视频 scrapy爬取头条视频爬取西瓜视频爬取阳光宽频网西瓜视频地址解析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xudailong_blog/article/details/81145796

版权

本文介绍了如何使用Python3和Scrapy框架在Windows 10环境下爬取今日头条视频，特别是西瓜视频的内容。首先从作者的视频列表页开始，通过AJAX接口获取JSON数据，利用max_behot_time参数进行接口拼接。在获取视频详情页时，注意视频的真实地址并非初始链接，而是通过视频ID解析得到。最后，文章分享了实际操作中的一些注意事项，如使用scrapy-redis、IP代理池和延迟策略，以及爬取的数据量。

摘要由CSDN通过智能技术生成

使用环境：

python3
scrapy
win10

爬取步骤

（1）从用户视频列表页开始
（2）使用ajax对接接口
（3）获取今日头条视频真实地址（西瓜视频真实地址）

备注：
这里的今日头条视频链接是直接跳转到365阳光宽频网的
https://www.365yg.com/

（1）我们要做的目标就是从把某个作者下的视频全部爬取下来。

（2）列表页下滑，获取xhr json数据

（3）xhr json获取规则: max_behot_time 参数的获取

最低0.47元/天解锁文章

关注

2
点赞
踩
11

收藏

觉得还不错? 一键收藏
6
评论
python3 scrapy抓取今日头条视频（西瓜视频）

使用环境：python3scrapywin10爬取步骤（1）从用户视频列表页开始（2）使用ajax对接接口（3）获取今日头条视频真实地址（西瓜视频真实地址）备注：这里的今日头条视频链接是直接跳转到365阳光宽频网的 https://www.365yg.com/ （1）我们要做的目标就是从把某个作者下的视频全部爬取下来。（2）列表页下滑，获取x...
复制链接

扫一扫

专栏目录

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。