Python脚本下载今日头条视频 附加Android版本辅助下载器

               

一、前言

今日头条有毒,这句话不是虚的,现在资讯类app中也就大黄易和今日头条可以博取用户一点喜好了,我所说的喜好不是指内容精彩,而是评论,玩过这两个app的人都知道,看的不是新闻本生内容,而是他逗逼的评论,也不得不服中国网友很有才。在今日头条和黄易中我学到了很多段子,成功的成为一个逗逼。


二、手动下载视频

喜欢今日头条的同学都知道今日头条的视频时有毒的,原因是没广告,而且内容是你想要的,网友都这么说:我在今日头条中看完了火影,不仅如此,现在加入了更多的自媒体,才华一个比一个牛逼,那短视频看的你乐乎的不要不要的,有时候想把一些精彩的视频分享到朋友圈或者微信好友,但是如果单纯的分享链接,感觉有点low逼了,所以本文就来介绍如何把今日头条的原生视频同步到微信中。

下面不多说了,直奔主题,我们随便打开一个今日头条的视频网页,发现并没有下载的按钮:

其实这时候我们可以人工的操作的,直接在这个页面按下F12键,查看这个页面的元素信息:


看到用的是video标签播放视频的,直接拿到他的src属性值就是视频的链接了,在用一个新窗口打开即可:


然后右击可以看到有一个菜单保存视频,将视频保存到本地即可。然后如果想把这个视频弄到微信中,那就更方便了,登录PC端微信,有一个文件传输助手,拖进去即可,手机端微信就可以保存这个视频分享给好友就可以了,不过这个视频大小是有限制的。然后如果想把视频分享到朋友圈:关于iOS中微信已经有可以分享本地视频的功能了,而Android这边没有这个功能可能需要借助插件,这个插件功能我在之前的文章说过了,不了解的同学可以点击这里进行查看:Android中如何实现分享本地视频到朋友圈中


三、分析视频链接构造过程

好了到这里我们发现这么几步就可以把视频弄到微信中了,但是这么看来是不是有点费劲,而且还需要手动,完全不符合一个程序猿的做事风格,所以咋们得写程序实现自动化。我们为了方便现在PC端上写脚本实现自动化下载这个视频,原理也很简单,用Python脚本进行网页爬虫,得到视频原链接即可,关于爬虫知识点不多介绍了,网上多的很,而用Python来爬非常方便的,不到100行代码即可。爬虫原理很简单:使用api获取整个页面内容,然后用正则表达式得到你想要的标签内容或者纯文本内容即可。下面就来看一下Python脚本中获取页面内容的代码:


看到了,这个是不是很简单,三行代码即可得到页面内容。我们把这个内容先保存到本地,然后进行分析:


执行完这个脚本之后,查看video.html内容,直接查找player那个div标签内容&

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
今日头条爬虫技术说明 ========== 整体思路 -------- 1. 抓取今日头条app的数据包 2. 分析数据包,找出请求的数据(如文章列表,文章url等) 3. 根据文章url等信息,抓取文章内容 4. 若文章中包含视频,则取视频url,然后下载 具体实现 ------ ### 一、抓包 ### 1. 工具:`Fiddler`、 `android`手机、`google浏览` 2. 步骤: (1)本示例采用[Fiddler](http://fiddler2.com/ "Fiddler")来抓包,安装到电脑,我的电脑是win10 (2)具体配置及使用请见[http://jingyan.baidu.com/article/03b2f78c7b6bb05ea237aed2.html](http://jingyan.baidu.com/article/03b2f78c7b6bb05ea237aed2.html "百度经验") (3)打开今日头条app,开始抓包,抓取到的包如下:![](http://i.imgur.com/fC3y96p.png) (4)经分析得知左侧的json文件及为文章列表,如图![](http://i.imgur.com/I2Z8Iph.png) 如右侧第一个content所指的json文件,文件内容为![](http://i.imgur.com/lwaDLHP.png)此时手机上的信息为 <img src = "http://i.imgur.com/LFSL1AA.png" width = "40%"> 可得上面的结论正确 ### 二、分析 ### 1. 分析所抓到的文章列表数据包:大致分为两类,一类是有视频的文章,一类则是没有视频的文章。 有视频的文章json内容里均有`video_id`这个key,如下图所示:![](http://i.imgur.com/T4hqaIc.png) 2. 没有视频的文章:json文件内容均包含`title`、 `abstract`、 `article_url`等信息,具体内容如下. -------- 该资源内项目源码是个人的毕设,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! <项目介绍> 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。 --------

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值