tudou,youku m3u8文件抓取地址

目前煎蛋能支持 iOS 设备播放优酷视频,因为优酷的html5格式比较有规律,比如视频页面地址是 http://v.youku.com/v_show/id_xxxx.html,那么 .m3u8 文件地址是 http://v.youku.com/player/getRealM3U8/vid/xxxx/type/mp4/v.m3u8,很好匹配。

但是作为两大视频巨头的土豆,貌似不能直接 html5 播放。。。网上个个都说优酷和土豆都能用 iPhone/iPad 直接看视频,我反复测试土豆就是不行。然后我在土豆页面源码中找到这个 js 文件:
http://js.tudouui.com/js/page/play/ios/iosplayer_14.js

从中分析土豆 .m3u8 文件地址应该是 http://m3u8.tdimg.com",u,r,q,t+".m3u8
而 u,r,q,t 这四个值如何取得就不知道了,跟土豆视频的页面地址 http://www.tudou.com/programs/view/xxxx/ 毫无关系。

然后我随便找了一个首页视频:http://www.tudou.com/programs/view/aW5KnswOcG4/
看它源码,页头有一段:


,title:"韩庚江铠同恋情遭李湘强行拆散 传何炅曾是二人红娘"
,icode:"aW5KnswOcG4"
,cid:"1"
,ctid:"_104391162"
,ename:"土豆娱乐小窝"
,cttime:1337078627000
,oid:"73656148"
,hd:0
,dl:true
,prv:0
,pic:" http://i3.tdimg.com/ 140/736/636/p.jpg"
,time:"02:10"

显示它的视频缩略图地址是: http://i3.tdimg.com/ 140/736/636/p.jpg

你猜结果怎样?土豆的 .m3u8 文件地址真的是 http://m3u8.tdimg.com/ 140/736/636/2.m3u8( 现在不是2,是3了)
测试了多个都是如此。我擦擦擦擦擦擦……

这太不科学了。估计要能在煎蛋支持 iOS 切换到 HTML5 方式播放的话,有两种方式:
1、用curl方式,抓取土豆视频页面的缩略图地址,再替换为.m3u8 文件地址
2、获取土豆的 api 做个专门插件,获取土豆视频的缩略图地址,再替换为.m3u8 文件地址
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
回答: 要实现Python爬虫爬取多个页面,可以采用增量爬虫的方式。增量爬虫是通过监测网站更新的情况,只抓取最新数据的一种方式,可以大大降低资源的消耗。当第一次运行爬虫程序时,爬虫会将所有的url抓取下来,并将这些url放入数据库中,并为每一个url生成专属的“指纹”。当网站更新后,第二次运行爬虫程序时,程序只会对数据库中不存在的指纹进行抓取,从而获取新数据的信息。这样可以避免重复抓取已经抓取过的数据,提高爬取效率。\[1\]\[3\]另外,如果要爬取动态加载的数据,可以通过查看页面源代码,找到数据加载的JS函数,并模拟执行该函数来获取数据。\[2\] #### 引用[.reference_title] - *1* *3* [Python爬虫:抓取多级页面数据](https://blog.csdn.net/pythonhy/article/details/128784799)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [Python 爬虫爬取多页数据](https://blog.csdn.net/weixin_39583222/article/details/109936174)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值