目录
一、paddleocr
PaddleOCR是一个基于百度飞桨的OCR工具库,包含总模型仅8.6M的超轻量级中文OCR1。它采用了先进的深度学习技术,包括卷积神经网络(CNN)和循环神经网络(RNN),以实现高精度的文字检测和识别。PaddleOCR广泛应用于各种场景,如车牌识别、文档分析、图像注释等2。
二、准备工作
1.paddleocr源程序下载
网址:https://github.com/PaddlePaddle/PaddleOCR
选择下载的版本:2.8.0
点击右上角Code下载源程序压缩包:
2.Opencv以及Cmake下载
Opencv下载地址:https://opencv.org/releases/ 我下载的是4.5.2版本
Cmake下载:https:cmake.org/download 推荐版本3.20.2
Git下载:https://git-scm.com/
下载好以后将这三个软件安装一下,具体安装步骤不在赘述,网上很多教程。
3.推理库下载
下载地址:
https://www.paddlepaddle.org.cn/inference/v3.0/guides/install/download_lib.html#windows
左上角可以选择推理库版本,我下载的是3.0.0-beta1版本
4.推理模型下载
下载地址:https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.8
此处下载的是中英文轻量模型。
5.整理解压
下载完成后所有文件如下图:
新建文件夹model将三个推理模型解压放入其中,新建文件夹inference将推理库解压放入其中,新建release文件夹,将源程序解压放入其中,如下图:
在release目录下找到以下路径:release\PaddleOCR-release-2.8\deploy\cpp_infer,创建新的文件夹buid 如下图:
到此准备工作结束,开始编译.
编译
1.工程编译
1.打开Cmake,将路径 release\PaddleOCR-release-2.8\deploy\cpp_infer下的文件CMakeLists.txt拖入Cmake,Browse Buid选择上面步骤创建的新文件夹buid。
然后点击Configure:
直接点击Finish。配置过程会出现报错是因为找不到Opencv与推理库的路径如下图
由于是配置的CPU版本,只需要在①处配置Opencv路径,②处配置推理库的路径,如下图:
路径配置好后点击Generate,等待编译完成后就可以点击Open Project 就可以打开生成好的项目了。将PPocr设置为启动项,将VS切换为Release。
然后点击生成项目会出现如下报错:
这是由于还缺少一个头文件,官方给出了这个头文件下载地址:https://paddleocr.bj.bcebos.com/deploy/cpp_infer/cpp_files/dirent.h
文件下载好后在buid目录下新建include文件夹,将下载的dirent.h放入其中。
工程包含头文件:
然后点击生成解决方案,有可能会出现以下报错:
这是由于下载的推理库版本问题,新版推理库中不存在mkldnn文件夹,打开推理库会发现是mkldnn文件夹被改成了onednn文件夹。
将生成后事件中mkldnn改为onednn
然后点击生成解决方案,已经可以编译通过了。
2.路径修改
打开args.cpp,将程序中的检测图片路径,和模型路径修改,如下图所示;
3.dll文件导入
将推理库的common.dll与paddle_inference.dll复制到程序执行目录下
将自己电脑安装的opencv_worldxx.dll考入执行目录下:
4.运行效果展示
总结
Paddleocr效果还是很不不错的。由于是纯小白,文中表述不准确的还望多多担待。