用开源的百度飞浆paddle比谷歌的tesseract效果好很多,错别字很少,并且支持docker镜像下载,但是离线使用时安装不太友好,下载的镜像跑不起来,需要在互联网上启动镜像后把容器打包成镜像再启动就可以。但是docker方式调试不太方便,如果直接调用代码的方法会比较方便,但是下载依赖会遇到一些问题。在docker中用接口调用的方式返回的结果是按算法自己划分的区域和区域内的文本的格式返回的,如果只想要文本结果的话需要直接调用方法。
ocr
最新推荐文章于 2024-03-10 06:46:56 发布