头条视频采集带GUI界面和代码详细注释

最新推荐文章于 2024-01-28 11:28:34 发布

canye

最新推荐文章于 2024-01-28 11:28:34 发布

阅读量1k

点赞数 1

分类专栏： python 文章标签： python 今日头条视频采集源码爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/canye/article/details/79535961

版权

本文为原创文章, 同时发布到本人的私人博客 http://www.caipiao365.vip/article/11

oschina: https://my.oschina.net/canye/blog/1630079

孩子特喜欢跳舞,以前下的视频看了好次了.想换短一点的新一点的视频.做为一个10多年的码农.是不可能手动一个个文件去下载的.当然想要一个方便的方法去下载自己想要的视频了.所以就想到了python.因为python在这方面有天生的优势.好了废话不多说先上几张图片看看效果.

下面言归正传来谈谈具体的细节。

第一步我们打开 https://www.toutiao.com/ 搜素关键词如儿童舞蹈

第二步打开开发者工具把搜索结果页面移动到最下面就会看到有 ?offset=20&format=json......这样的连接如下图片

通过分析发现这个连接是用来异步获取搜索结果的具体参数如说明如下:

"offset": nPages, #记录的开始数字 0开始 0 20 40 60 具体见 count 字段默认是每页有20条记录但是每面多多少少有些广告

"format": "json", #返回的数据类型

"keyword": serchStr, #要搜索的关键词

"autoload": "true", #html网页获取记录后是否自动显示的页面里

"count": "20", #每次请求返回的记录大小（建议和前台的页面保持一致）我设置其他的,他们的的服务器也只每次返回20条记录

"cur_tab": "2", #前面页面的标签（可以用2不用管他和前台的页面保持一致）

"from": "search_tab", #提交搜索的前面页面的表单名（不用管他就用这个也就是cur_tab 2）

"callback": JSARRNAME #Json数据返回后前台页面JS代码里数组的名字这个我改了一个他的太长了点看不习惯 @_@

这个说明具体见 net\DownVideo.py里的 DownVideoMgr类的GetParas方法

然后在看一下这个连接返回的数据：

当时一看乐了，是mp4的地址,这不是非常非常简单吗.从网上用python下个文件就几行代码的事情.这样的话就非常快速的加上了下载文件的方法:

最低0.47元/天解锁文章

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
头条视频采集带GUI界面和代码详细注释

本文为原创文章, 同时发布到本人的私人博客 http://www.caipiao365.vip/article/11 oschina: https://my.oschina.net/canye/blog/1630079 孩子特喜欢跳舞,以前下的视频看了好次了...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。