前言:最近在研究优酷真实地址解析,遇到一个问题,关于优酷的专辑页面使用的似乎不是直接将所有的视频地址放在页面中,采用的是将视频地址存在数据库,在用户点击日期的时候才进行读取,因此只要获得读取地址,对于优酷的专辑解析也就不费力了。
网页地址:http://www.youku.com/show_page/id_z370fd4969ac311e4b522.html?from=y1.12-85
采用万能的chrome打开,习惯性打开开发者工具(Ctrl+Shit+I),选择Network
随便点击一个日期,发现了封包信息,这是一个Get请求。
复制这个Get请求的地址,打开看,以下是这个Get请求的地址以及网页中的变化。
看来对了,那么这个Get请求中对应的reload_201506就是地址,id_z370fd4969ac311e4b522就是专辑地址。
整理下,解析专辑需要reload_id和id_vid。那么只需要解析专辑页面中的含reload对应的id接着一步步的get即可了。