使用tesseract-ocr实现图片文字识别 docker版

最新推荐文章于 2024-05-09 16:47:48 发布

置顶

IT老吴

最新推荐文章于 2024-05-09 16:47:48 发布

阅读量2.1k

点赞数 4

分类专栏：人工智能 # docker 文章标签： docker 深度学习机器学习

本文链接：https://blog.csdn.net/weixin_36572983/article/details/105478190

版权

前言

工作需要，有大量图片上的文字需要识别（比如英文小说）。所以打算安装一个Tesseract，然后进行一点orc方面的开发。

docker版tesseract-ocr

通过使用docker镜像，可以省去安装环节，轻松的实现ocr。

单张图片识别，直接启动镜像，将图片文件夹挂载到容器内，调用entrypoint命令识别。

# 拉镜像
docker pull jitesoft/tesseract-ocr:20.04
# 直接指定图片地址，进行识别
docker run -v ~/文档/_04dockervolume/anaconda3/notebooks:/tmp jitesoft/tesseract-ocr:20.04 /tmp/1.png stdout

如果有大量图片需要处理，可以：

cd ~/文档/_04dockervolume/anaconda3
#创建一个init.sh，以便在镜像中执行，这里如果多层文件夹的话，改为函数，递归调用即可。
cat <<EOF >

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

IT老吴

关注关注

4
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
使用tesseract-ocr实现图片文字识别 docker版

工作需要，有大量图片上的文字需要识别（比如英文小说）。所以打算安装一个Tesseract，然后进行一点orc方面的开发。通过使用docker镜像，可以省去安装环节，轻松的实现ocr。单张图片识别，直接启动镜像，将图片文件夹挂载到容器内，调用命令识别。批量图片识别，写个shell脚本处理。
复制链接

扫一扫