tesseract 安装

ubuntu:

sudo apt-get tesseract-ocr
可以来张图片试试
![test](https://img-blog.csdn.net/20171225183503511?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvSnNvbl9TdGV2ZQ==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
python@ubuntu:~/Desktop/tesseract_test$ tesseract tesseracttest.jpg text
Tesseract Open Source OCR Engine v3.04.01 with Leptonica
python@ubuntu:~/Desktop/tesseract_test$ cat text.txt 
This is some text, written in Arial, that will be read by
Tesseract. Here are some symbols: !@#$%"&*()
结果ok
但是可能没有中文的训练库
python@ubuntu:~/Desktop/tesseract_test$ tesseract --list-langs
List of available languages (3):
osd
eng
equ
在我的资源里会有
你需要增加资源库:
资源库在哪?
    python@ubuntu:~/Desktop/tesseract_test$ locate tessdata
/usr/bin/combine_tessdata
/usr/share/man/man1/combine_tessdata.1.gz
/usr/share/tesseract-ocr/tessdata
/usr/share/tesseract-ocr/tessdata/configs
/usr/share/tesseract-ocr/tessdata/eng.cube.bigrams
/usr/share/tesseract-ocr/tessdata/eng.cube.fold
/usr/share/tesseract-ocr/tessdata/eng.cube.lm
/usr/share/tesseract-ocr/tessdata/eng.cube.nn
/usr/share/tesseract-ocr/tessdata/eng.cube.params
/usr/share/tesseract-ocr/tessdata/eng.cube.size
/usr/share/tesseract-ocr/tessdata/eng.cube.word-freq
/usr/share/tesseract-ocr/tessdata/eng.tesseract_cube.nn
/usr/share/tesseract-ocr/tessdata/eng.traineddata
/usr/share/tesseract-ocr/tessdata/equ.traineddata
/usr/share/tesseract-ocr/tessdata/osd.traineddata
/usr/share/tesseract-ocr/tessdata/pdf.ttf
/usr/share/tesseract-ocr/tessdata/tessconfigs
/usr/share/tesseract-ocr/tessdata/configs/ambigs.train
/usr/share/tesseract-ocr/tessdata/configs/api_config
/usr/share/tesseract-ocr/tessdata/configs/bigram
/usr/share/tesseract-ocr/tessdata/configs/box.train
/usr/share/tesseract-ocr/tessdata/configs/box.train.stderr
/usr/share/tesseract-ocr/tessdata/configs/digits
/usr/share/tesseract-ocr/tessdata/configs/hocr
/usr/share/tesseract-ocr/tessdata/configs/inter
/usr/share/tesseract-ocr/tessdata/configs/kannada
/usr/share/tesseract-ocr/tessdata/configs/linebox
/usr/share/tesseract-ocr/tessdata/configs/logfile
/usr/share/tesseract-ocr/tessdata/configs/makebox
/usr/share/tesseract-ocr/tessdata/configs/pdf
/usr/share/tesseract-ocr/tessdata/configs/quiet
/usr/share/tesseract-ocr/tessdata/configs/rebox
/usr/share/tesseract-ocr/tessdata/configs/strokewidth
/usr/share/tesseract-ocr/tessdata/configs/txt
/usr/share/tesseract-ocr/tessdata/configs/unlv
/usr/share/tesseract-ocr/tessdata/tessconfigs/batch
/usr/share/tesseract-ocr/tessdata/tessconfigs/batch.nochop
/usr/share/tesseract-ocr/tessdata/tessconfigs/matdemo
/usr/share/tesseract-ocr/tessdata/tessconfigs/msdemo
/usr/share/tesseract-ocr/tessdata/tessconfigs/nobatch
/usr/share/tesseract-ocr/tessdata/tessconfigs/segdemo
/usr/share/tesseract-ocr/这就是目录
那么把下载的tessdata里的训练库添加到tessdata里就行了:
python@ubuntu:~/Desktop/tesseract_test/tessdata$ sudo cp chi_sim.traineddata /usr/share/tesseract-ocr/tessdata/
chi_sim.traineddata这个是中文的训练库。
看一下成功没:
python@ubuntu:/usr/share/tesseract-ocr/tessdata$ tesseract --list-langs
List of available languages (4):
chi_sim
osd
eng
equ
这就多一个中文库,找张图片试一下

test2

python@ubuntu:~/Desktop/tesseract_test$ tesseract -l chi_sim 排序算法.png text3
Tesseract Open Source OCR Engine v3.04.01 with Leptonica
python@ubuntu:~/Desktop/tesseract_test$ 
python@ubuntu:~/Desktop/tesseract_test$ 
python@ubuntu:~/Desktop/tesseract_test$ cat text3.txt 
模板:排序算法











覃 ' 论 ' 绵 排序算法
瑾论 计算复杂性理论 - 大〇符号 - 全序关系 - 列表 - 稳定性 - 比较排序 - 自适应排序 - 排序网络 - 整数排序
交换排序 冒泡排序 - 鸡尾酒排序 - 奇偶排序 - 梳排序 - 侏儒排序 - 快速排序 - 臭皮匠排序 - Bogo排序
选择排序 选择排序 - 堆排序 - 平滑排序 - 笛卡尔树排序 - 锦标赛排序 - -排序
插入排序 撞入排序 - 希尔排序 - Splcy排序 - 二叉查找树排序 - 图书馆排序 - 耐心排序
归井排序 归荠排序 - 梯级归并排序 - 振荡归并排序 - 多相归并排序 - 吕列排序
分布排序 美国旗帜排序 - 珠排序 - 桶排序 - 憬炸排序 - 计数排序 - 鸽巢排序 - 相邻图排序 - 基数排序 - 闪电排序 - 撞值排序
井发排序 双调排序器 - BGtCher归并网络 - 两两排序网络
混台排序 区块排序 - Tím排序 - 内省排序 - SpreGd排序 - 」排序
其他 拓扑排序 - 煎饼排序 - 意粉排序

憧靓





评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值