WEB自动化(1)环境安装及打开浏览器实例
WEB自动化(2)常用的元素定位方法之xpath详解
WEB自动化(3)PO设计模式原理与实现
WEB自动化(4)使用selenium将网站验证码截图保存为本地图片
WEB自动化(5)获取网站验证码即从验证码截图中获取图片中的字符串
WEB自动化(6)WEB自动化及脚本在Linux系统上正常运行一段时间后报session not created from tab crashed 的错误的解决办法
(1)安装依赖库
pip install pillow
pip install pytesseract
(2)下载安装Tesseract-OCR
1)从Tesseract-OCR 下载地址挑选合适的版本,下载安装包,比如这里下载一个比较新的版本
2)下载完成后右键-以管理员权限执行,然后点击【next】
3)点击【同意】
4)保持默认,点击【next】
5)保持默认,点击【next】
6)选择安装位置,这里选择D盘,并且新建一个文件夹
7)点击【install】
8)点击【next】
9)点击【finish】
(3)修改pytesseract.py文件
找到pytesseract.py文件,在python的安装环境中,比如这里在C:\Users\hitre.virtualenvs\summer_ospp_autotest-MVJ0ZKcH\Lib\site-packages\pytesseract\pytesseract.py,打开后搜索 ‘tesseract_cmd =’,然后将其值设置为上述安装路径中exe的绝对路径,如:
(4)对于比较简单的验证码,如:
(5)编写如下代码
如上述图片保存为“verify_code.png”
import pytesseract
from PIL import Image
im = Image.open(r'verify_code.png')
code=pytesseract.image_to_string(im)
print(code)
执行如下: