PTL: 是用于对图片进行操作的第三方库, 实现对图片的旋转, 缩放, 剪切, 放大, 缩小等操作(一般用于截取验证码)
安装: pip install pillow
实例: 验证码截取策略
1> 将整个网页的内容全部截取下来
2> 在根据验证码图片在整个页面中的x坐标和y坐标, 以及图片自身的宽度和高度, 从整个网页的截图中再接验证码图片
通过selenium来演示
driver = webdriver.Firefox()
driver.get('目标网址')
截取整个页面
driver.save_screenshot('page.png')
定位验证码标签, 对验证码实现截图功能
captcha = xxxxxxxxxx验证码所在标签xxxxxxxxxx
获取验证码图片的x, y坐标, 及自身宽度和高度
left = captcha.location['x']
top = captcha.location['y']
right = left + captcha.size['width']
bottom = top +captcha.size['height']
截取验证码
img = Image.open('page.png')
img = img.crop((left, top, right, bottom))
保存到本地
img.save('captcha.png')
最后一般将次验证码图片上传到云打码进行在线识别
(关于云打码在线识别可以查看博客其它内容)
关于PIL截图的逻辑:
左上(x)右下(y), 图片两点确定之后在把长宽加上, 验证码图片就截取出来了
如果感觉内容不错的话,支持一下作者。