![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
终年小雪
这个作者很懒,什么都没留下…
展开
-
点击旋转验证码破解
以极速漫画为例http://www.1kkk.com/ 这类的网站验证码使用点击旋转,来登录。笔者提出的思路简单暴力,直接想办法获得所有正确图片,然后在登录时爬取这4张动漫图片,做旋转对比得出点击次数查看网页数据加载可以看到在每次点击“换一组”就会加载新的图片 查看图片加载链接 http://www.1kkk.com/image3.ashx?t=1537269577000 ...原创 2018-09-18 21:56:20 · 5521 阅读 · 0 评论 -
爬虫B站滑动验证码模拟登陆。
思路计算出图案中滑块的位置就可以使用selenium来模拟登陆分析检查分析网页代码找到了图片所在div获得该div的class用来截取该图片与有缺口的图做对求出图片需要滑动的距离就可以了 -代码import timefrom io import BytesIOfrom PIL import Imagefrom selenium import webdri...原创 2018-09-23 16:49:33 · 3528 阅读 · 4 评论 -
爬取酷狗音乐
思路获得榜单超链接列表 遍历榜单列表拿到,各个榜单歌曲超链接 遍历歌曲超链接,播放歌曲 播放页面就可以将歌曲爬下来(有版权的依然爬不到,笔者还在想办法) 在播放界面获得歌曲名 在播放页面(播放时一般有flash)找到歌曲的超链接。下载就可以了,(qq音乐无法使用同样的方法,QQ音乐进入播放页面时默认不播放,直接网址进入是空白页面。虾米音乐的下载链接是在歌曲超链接哪里,...原创 2018-09-23 17:45:21 · 1670 阅读 · 2 评论 -
爬虫虾米音乐
思路找到歌单的歌曲列表 找到MP3超链接(虾米的链接需要进行凯撒解码) 解码后,直接二进制写进文件即可代码获取超链接import timeimport requestsfrom lxml import etreefrom selenium import webdriverfrom selenium.webdriver.common.by import By...原创 2018-09-23 18:24:42 · 1034 阅读 · 0 评论