本文将介绍PaddleOCR在CentOS8系统中的离线绿色部署,CentOS7部署方式同样,只是系统需要安装支持C++14的依赖,安装glibc-2.28版本。
PaddleOCR在CentOS8系统中的绿色部署
首先下载CentOS8操作系统镜像,使用虚拟机安装CentOS8操作系统。并上传PaddleOCR_Linux_4.4.0绿色文件包到centos8系统内。
离线绿色部署包内包含OCR的模型文件,以及所有的.so依赖库。一个由.net6.0编译的调用OCR示例控制台程序。
启动命令:
LD_LIBRARY_PATH=./lib ./ConsoleAppNET
也可以运行run.sh文件,
效果如下:
perfect
离线、绿色、高性能、极简部署OCR
.net示例极简代码,仅一行即可
Console.WriteLine(new PaddleOCRSharp.PaddleOCREngine().DetectText("test.jpg").Text);
四、PaddleOCR介绍
PaddleOCRSharp 是一个基于百度飞桨PaddleOCR的开源代码修改并优化的.NET版本OCR可离线使用类库。项目核心组件PaddleOCR.dll,由C++编写,根据百度飞桨PaddleOCR的C++代码修改并优化而成。目前已经支持C++、.NET、Python、Golang、Rust等众多开发语言的直接API接口调用。项目包含文本识别、文本检测、表格识别功能。本项目针对小图识别不准的情况下做了优化,同时做了其他优化,比飞桨原代码识别准确率有所提高,速度更快。包含总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持中英文、纯英文以及多种语言文本检测识别。
PaddleOCRSharp封装极其简化,实际调用仅几行代码,极大地方便了中下游开发者的使用和降低了PaddleOCR的使用入门级别,同时提供不同的.NET框架使用,方便各个行业应用开发与部署。Nuget包即装即用,可以离线部署,不需要网络就可以识别的高精度中英文OCR。
本项目支持官方所有公开的通用OCR模型,PPOCRV2、PPOCRV3、PPOCRV4。
★windows系统支持:win7SP1、win10、win11、winserver2012R2、winserver2016、winserver2019、winserver2022等
★linux系统支持(付费支持):统信UOS、麒麟、ubuntu、Centos等。
支持智能标注
可视化训练工具
五、结束语
PaddleOCR部署采用C++编码,具有以下特点:
高性能:
PaddleOCR基于PaddlePaddle深度学习框架,后者具有强大的计算性能和高效的并行计算能力。这使得PaddleOCR能够快速处理大规模的文本识别任务,尤其适用于需要高速处理大量图像数据的场景。
通过C++的部署方案,PaddleOCR能够进一步利用C++的高性能特性,优化内存管理和计算效率,从而提升整体性能。
多功能性:
PaddleOCR支持多种文本识别任务,包括文字检测、文字识别、场景文字识别等。这些功能通过C++的部署方案同样可以得到支持,满足不同场景下的文字识别需求。
此外,PaddleOCR还支持多种语言和手写体的识别,进一步扩展了其应用场景。
易用性:
PaddleOCR提供了简洁易用的API接口,方便开发者在C++环境中快速部署和使用OCR功能。
同时,PaddleOCR还提供了详细的文档和示例代码,帮助开发者快速上手并进行二次开发。
开源免费:
PaddleOCR是开源项目,其代码和模型都可以免费获取和使用。这意味着开发者可以根据自己的需求自由修改和定制PaddleOCR,以满足特定的应用场景。
支持定制化和扩展:
开发者可以根据自己的需求选择合适的PaddleOCR模型,并进行定制化和扩展。例如,可以通过训练自己的模型来优化特定场景下的识别效果。
此外,PaddleOCR还支持多种后端和前端技术的集成,方便开发者将其嵌入到自己的应用系统中。
通过结合PaddlePaddle深度学习框架的强大功能和C++的高性能特性,PaddleOCR能够为用户提供高效、准确、易用的OCR解决方案。
欢迎扫码关注微信公众号,或者加入QQ群,了解更多内容。