因测试工作需要,想弄下ocr自动识别验证码,然后又想起了PaddleOCR,但是不知道官方提供的几种模型对目前的验证码识别效果如何,就在windows电脑上,先调试一把;
需求:自动识别验证码
参考: 部署手册https://gitee.com/paddlepaddle/PaddleOCR/blob/release/2.4/doc/doc_ch/environment.md
安装如上,按照官方的步骤,一步步很容易的;下面我要说的是关键步骤中个人的一点心得,希望可以让大家更容易理解官方的部署手册吧;
每次新打开一个Anaconda Prompt启动控制台后,一定要先激活paddle_env环境,在使用;
# 激活paddle_env环境 conda activate paddle_env (发现直接在cmd命令行也可以直接使用)
然后是服务端部署https://gitee.com/paddlepaddle/PaddleOCR/blob/release/2.4/deploy/hubserving/readme.md
再然后是
解压后,把模型解压到下面的文件夹里面
在然后用下面的命令安装服务模块
碰到缺少dll问题解决办法(下面的图我原先没有切换到paddle_env环境,后来切换了paddle_env环境,发现一样有问题,后面就没有截图,问题是一样的):
解决缺少dll文件 下载,如果打开或下载的慢,可以用我这个下载好的文件
(paddle_env环境·)然后把下面的依赖包先安装上去:
pip install scikit-image
pip install pyclipper
pip install shapely
pip install imgaug
pip install lmdb
如果跟我一样碰到下面类似的包冲突,可以不用管
然后在前面所说的PaddleOCR根目录下启动:
hub serving start -m ocr_system
另起一个cmd窗口 执行如下命令:
python tools/test_hubserving.py server_url image_path
URL和突破路径换成实际的
最后发现前面安装的模型根本识别不了我的验证码
然后下载了server端的模型,替换了下:
然后发现好了那么一点点,但是离实际效果还是有点差异
看样子后续要研究下怎么训练数据,弄匹配的模型了
大家可以体验下,对于我的验证码识别率有30%左右的成功率,感觉还可以用一下的