关闭

优酷专辑采集与分析

53人阅读 评论(0) 收藏 举报
分类:

前言:最近在研究优酷真实地址解析,遇到一个问题,关于优酷的专辑页面使用的似乎不是直接将所有的视频地址放在页面中,采用的是将视频地址存在数据库,在用户点击日期的时候才进行读取,因此只要获得读取地址,对于优酷的专辑解析也就不费力了。


网页地址:http://www.youku.com/show_page/id_z370fd4969ac311e4b522.html?from=y1.12-85

采用万能的chrome打开,习惯性打开开发者工具(Ctrl+Shit+I),选择Network


随便点击一个日期,发现了封包信息,这是一个Get请求。


复制这个Get请求的地址,打开看,以下是这个Get请求的地址以及网页中的变化。


看来对了,那么这个Get请求中对应的reload_201506就是地址,id_z370fd4969ac311e4b522就是专辑地址。

整理下,解析专辑需要reload_id和id_vid。那么只需要解析专辑页面中的含reload对应的id接着一步步的get即可了。

0
0

猜你在找
【直播】机器学习&数据挖掘7周实训--韦玮
【套餐】系统集成项目管理工程师顺利通关--徐朋
【直播】3小时掌握Docker最佳实战-徐西宁
【套餐】机器学习系列套餐(算法+实战)--唐宇迪
【直播】计算机视觉原理及实战--屈教授
【套餐】微信订阅号+服务号Java版 v2.0--翟东平
【直播】机器学习之矩阵--黄博士
【套餐】微信订阅号+服务号Java版 v2.0--翟东平
【直播】机器学习之凸优化--马博士
【套餐】Javascript 设计模式实战--曾亮
查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:55次
    • 积分:10
    • 等级:
    • 排名:千里之外
    • 原创:1篇
    • 转载:0篇
    • 译文:0篇
    • 评论:0条
    文章分类
    文章存档
    阅读排行
    评论排行