因为好奇,打算从qq音乐http://y.qq.com/#type=index 抓取它的专辑封面http://y.qq.com/#type=album&index= ,不得不佩服qq产品做的都很精细,专辑封面都是非常
的全,而且清晰度还不错。
本来准备分析qq音乐专辑页面,这样只要解析一下html文件,就可以找出专辑了(以前抓取人人好友相册的时候就是这么干的)。不过保存网页分析之后,找不到专辑信息,原来是iframe的原因,网页嵌套网页,后面还有一堆js代码。网上搜了一下关于python如何解析iframe,但是没有成功,就用chrome自带的开发人员工具或者点这里分析 访问http://y.qq.com/#type=album&index= 产生的所有交互。
重点分析Network标签就行了,里面有一个fcg_album_list.fcg,