搜狐视频爬url

最近迷上了疑犯追踪,以前用快播,美剧和H两不误~~。结果最近反H热火朝天,还是转到搜狐视频趁早当个良民。

给力的搜狐竟然还有原画,让以前在快播看马赛克画质的我立马换上钛合金狗眼~~

准备要收藏,就要爬爬站~~

百度谷歌一把 搜到俩教程

http://44670.org/index.php/archives/36/

http://blog.csdn.net/u5a75/article/details/22786397

还有

http://imtx.me/archives/1570.html


--------------------------------------------------------------

首先随便找个视频,比如这个:

http://tv.sohu.com/20130331/n371216235.shtml

 

查看页面源代码,搜索var vid="

找到var
vid="1037347";即为
videoid

 

构造urlhttp://hot.vrs.sohu.com/vrs_flash.action?vid=1037347

获取到一个json

allot项值为220.181.61.229,获取key时会用到(似乎会变动,以你看到的为准,下同)

clipsURL项为各个分段的url,显然不能直接下载

su项为一组字符串,目测和各个视频分段是一一对应的

 

以获取第一分段视频为例,找到clipsURL为:

http://data.vod.itc.cn/tv/20130331/783313-1037347-e73d8457-f174-43c5-8c69-5e34a641c907.mp4

su为:

/175/208/CPOjUPsgPyLl4qGtMDGXv4.mp4

 

构造url

http://220.181.61.229/?prot=2&t=0.123123&file=tv/20130331/783313-1037347-e73d8457-f174-43c5-8c69-5e34a641c907.mp4&new=/175/208/CPOjUPsgPyLl4qGtMDGXv4.mp4

解释下各个参数:prot=2固定,t为随意的一个小数,file为之前的clipsURL去掉域名后的路径,new即为之前获取的su

 

可获取到用“|”分隔的一组字符串

取第一项和第四项:

baseUrl=http://117.21.183.7/sohu/3/

key=qOl9qfQPwues1O1RzWjs-i8dzjKnmrylbHPXJw..

key可能会过期失效,解析与下载应同时进行

 

构造url:

http://117.21.183.7/sohu/3/175/208/CPOjUPsgPyLl4qGtMDGXv4.mp4?key=qOl9qfQPwues1O1RzWjs-i8dzjKnmrylbHPXJw..

(即baseUrl+su+"?key="+key,注意把重复的“/”去掉)

 

即为视频真实地址。


以上教程比较老  其他教程作了补充:

”sohu这货不同清晰度视频的vid都不一样,'oriVid' 'superVid' 'highVid' 'norVid'分别代表原画,超清,高清,标清的vid。“

https://code.csdn.net/warmb123/python_analy_sohu_video


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值