阿里测试员是怎么解决Airtest不能中文识别，原来好so easy！

最新推荐文章于 2024-08-28 21:42:24 发布

程序员-小枫

最新推荐文章于 2024-08-28 21:42:24 发布

阅读量807

点赞数

分类专栏：自动化测试软件测试测试流程文章标签：软件测试 python linux

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_49346599/article/details/108364609

版权

本文介绍了如何使用Airtest结合Tesseract OCR进行图像识别，特别是中文识别。通过设置环境变量、安装必要的库，以及使用特定的截图和识别方法，可以有效地在自动化测试中处理文字识别问题，包括验证码和截图中的中文文字。

摘要由CSDN通过智能技术生成

Airtest是一款基于图像识别原理的跨平台UI自动化测试框架，它能够根据大量的特征点来识别一个截图在当前画面中的位置，但是它并不能识别出截图中具体包含了什么文字。

而在自动化测试的过程中，我们会经常遇到需要进行文字识别的场景，比如识别验证码、识别截图中的文字、读取截图中的数值等等，遇到这些情况时我们可以如何处理呢？

今天教大家用一款免费的开源图像OCR文字识别软件 – Tesseract-OCR 来处理上述情况。

1.安装Tesseract-OCR.exe
自动化软件测试交流群：1140267353，领取最新软件测试资料大厂面试和Python自动化学习资料！一起学习交流
在网上搜索“Tesseract”，我们可以找到很多Tesseract-OCR的下载链接和安装教程，大家可以选择其中一个版本下载到本地即可。

下载完成后双击进入安装，需要特别注意的是，在选择安装的组件时，我们需要把 Additional language data(download) 这一选项勾上，目的是安装各个版本的语言包，后续我们就不用手动下载语言包来安装了。
在这里插入图片描述

还有一点要注意的是，记住我们选择的软件安装路径，因为我们需要把这个路径添加到系统环境变量的 path 中：
另外一个要新增的环境变量是 TESSDATA_PREFIX ，如下图所示，未设置在识别过程中会报 Please make sure the TESSDATA

最低0.47元/天解锁文章

程序员-小枫

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。