昨天在某公众号看见一篇关于用python爬王者荣耀中所有英雄的皮肤的文章,
https://mp.weixin.qq.com/s/UgF5FYJ5dX1aNw6K0E_Jjw
感觉挺有趣的,下载来当壁纸也不错,就动手一波,环境用的是python3。过程中也遇到了一点问题,所以记录下来
第一步首先打开
http://pvp.qq.com/web201605/herolist.shtml F12分析一波网页结构。。。
通常写这种爬虫,一般都是先分析结构,简单判断下是否有反爬机制。。看下正则表达式怎么写或者使用beatifulsoup的解析器然后再用urllib的套件下载。。。但是在经过数次尝试后发现其中有点坑。。。原因是这个页面有些英雄的链接及图片是通过js加载出来的,源代码里面根本没有。。比如这个新出的英雄司马懿。。。右键直接查看源代码。。发现第一个显示的英雄是狂铁。。(扎心)