最近追剧时发现找资源挺繁琐的,网页切换来切换去耗时也多,所以就想写个脚本代替。于是今下午花了点时间,先对人人影视进行了资源爬取。
抓包分析
搜索页面
打开工作台,选择NETWORK,刷新之后,如图:
图中指出的就是搜索接口‘ http ://www.zimuzu.tv/search/index?keyword=西部世界&search_type=resource ’
就两参数:keywd和search_type(搜索类型)
影视资源页面
点进西部世界的资源面,我们接着要获取什么呢?当然是下载链接了。
没错,就是蓝色的资源下载页,再次抓包分析。
没错就是图中箭头所指的tv,这就是接口,
Request URL:http://www.zimuzu.tv/resource/index_json/rid/33701/channel/tv
分析多个页面后,发现只有33701是变化的,它就在西部世界url中(http://www.zimuzu.tv/resource/33701)
看他的返回值,是一个类似json格式的数据,但不规范。如图:
把鼠标移到跳转下载链接上,发现是http ://zmz003.com/v5ta03 ,搜索一下 v5ta03 ,就能找到了。如图:
5.22更新完善
今天使用时,发现报了错,有些资源抓取不到。再次抓包分析后,发现资源分为两类:电视剧、电影。
电影的接口是 movie,类似:
Request URL:http://www.zimuzu.tv/resource/index_json/rid/22376/channel/movie
获取百度云,电驴等连接
接下来就简单了,静态页面,有点经验就OK的。如图: