优酷专辑采集与分析

前言:最近在研究优酷真实地址解析,遇到一个问题,关于优酷的专辑页面使用的似乎不是直接将所有的视频地址放在页面中,采用的是将视频地址存在数据库,在用户点击日期的时候才进行读取,因此只要获得读取地址,对于优酷的专辑解析也就不费力了。


网页地址:http://www.youku.com/show_page/id_z370fd4969ac311e4b522.html?from=y1.12-85

采用万能的chrome打开,习惯性打开开发者工具(Ctrl+Shit+I),选择Network


随便点击一个日期,发现了封包信息,这是一个Get请求。


复制这个Get请求的地址,打开看,以下是这个Get请求的地址以及网页中的变化。


看来对了,那么这个Get请求中对应的reload_201506就是地址,id_z370fd4969ac311e4b522就是专辑地址。

整理下,解析专辑需要reload_id和id_vid。那么只需要解析专辑页面中的含reload对应的id接着一步步的get即可了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值