python自动化脚本 索引定位iframe_巧用Python脚本解决自动化图形验证码难题

3d88782bc356ef768d665762bd445332.gif

有头发且有趣的码农万里挑一~ 

65

有料叔 | 一位有故事的程序猿

ae43f583ac9b22f3e29386a26d19ab62.gif

目标

解决UI自动化过程中的图文验证码问题,过程大致分为两个步骤:

1. 自动下载网页上指定的图片

2. 识别图片上的文本内容

本文以“识别页面上指定图片的文本“为例。

代码实现效果

499795bed2e6d110a9e172c3c3611d11.png

环境准备
  • Pytesseract

  • Tesseract-OCR

  • Pillow

 手动安装pytesseract库 

命令:pip install pytesseract

22e7bed050fa84d316db603295d3341c.png

 安装Tesseract-OCR.exe 

下载地址 

http://8rr.co/Krrw

4063b8d4f5e8d744105c5620b96c3588.png

双击exe程序直接安装即可

a892af6b126d94caa89e218099f600d6.png

 配置环境变量 

470a36c5aefd17057533848ae507426c.pngf9db13cfd402d6f46519d70f7d91a072.png

 校验安装成功 

9159843f7fe69b99653781dcfe25fddb.png

 安装Pillow包 

Python自带的图文简单处理模块,正常安装Python的时候会自动安装,故无需另外手动安装。(若没自动安装则可手动安装:pip install Pillow)

 代码正文 

初始化浏览器和元素定位方式

  • 初始化并放大浏览器

  • 初始化元素定位方式:本文使用CSS选择器方式定位

75334b557d8924119f3fd68210a4dbb1.png69e7a0bdf3fb98f3010963a4582360b7.png

 获取图片 

  • 页面全屏截图

  • 截图转为Image对

  • 获取指定图片的大小和位置

  • 裁剪图片

607de21df5468cc0684f58893479c096.png128a0bb265cc13638c04bf56c10aa07b.png

 识别图片上的文本 

  • 识别裁剪后的图片上的文本内容

 

9cd92c7d95f0fbfbf70d603c914d4ce8.pngd33be9ab982a1abd3fcc1baa480bce98.png

问题:

Python脚本运行报错:

a905a2f50ad62c5a64b0783434ff7402.png

解决方案:

修改tesseract文件的默认路径

38915c262e2f003a4fa0121c6ce36917.png

码 学 习 码 同 学 福 利 课 程 哦

19ac5776ec17f7de9169f06da9bea8e1.png

加 微 信   回 复 关 键 字  “训 练 营”ed9d546c8b262885078e3e8bb21826c7.png

7bec197348e04dc2f1ff446d73a74217.png
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值