本文为原创文章, 同时发布到本人的私人博客 http://www.caipiao365.vip/article/11
oschina: https://my.oschina.net/canye/blog/1630079
孩子特喜欢跳舞,以前下的视频看了好次了.想换短一点的新一点的视频.做为一个10多年的码农.是不可能手动一个个文件去下载的.当然想要一个方便的方法去下载自己想要的视频了.所以就想到了python.因为python在这方面有天生的优势.好了废话不多说先上几张图片看看效果.
下面言归正传来谈谈具体的细节。
第一步 我们打开 https://www.toutiao.com/ 搜素关键词 如 儿童舞蹈
第二步 打开 开发者工具 把搜索结果页面移动到 最下面 就会看到有 ?offset=20&format=json......这样的连接 如下图片
通过分析发现 这个连接是用来异步获取搜索结果的具体参数如说明如下:
"offset": nPages, #记录的开始数字 0开始 0 20 40 60 具体见 count 字段 默认是每页有20条记录但是每面多多少少有些广告
"format": "json", #返回的数据类型
"keyword": serchStr, #要搜索的关键词
"autoload": "true", #html网页获取记录后是否自动显示的页面里
"count": "20", #每次请求返回的记录大小(建议和前台的页面保持一致) 我设置其他的,他们的的服务器也只每次返回20条记录
"cur_tab": "2", #前面页面的标签(可以用2不用管他 和前台的页面保持一致)
"from": "search_tab", #提交搜索的前面页面的表单名(不用管他就用这个 也就是cur_tab 2)
"callback": JSARRNAME #Json数据返回后前台页面JS代码里数组的名字这个我改了一个 他的太长了点 看不习惯 @_@
这个说明具体见 net\DownVideo.py里的 DownVideoMgr类的GetParas方法
然后在看一下这个连接返回的数据:
当时一看乐了,是mp4的地址,这不是非常非常简单吗.从网上用python下个文件就几行代码的事情.这样的话就非常快速的加上了下载文件的方法: