Python(应用) — Tesseract图片文字识别(一)

Mac安装Tesseract-OCR

安装: brew install tesseract


语言库

下载地址:https://github.com/tesseract-ocr/tessdata

简体中文库:chi_sim.traineddata

下载简体中文库chi_sim.traineddata,然后将文件拷贝到到:/usr/local/Cellar/tesseract/3.04.01_2/share/tessdata 目录下即可。


库名对应的文件简称

库名语言
afrAfrikaans(南非荷兰语)
amhAmharic(阿姆哈拉语)
araArabic(阿拉伯语)
asmAssamese(阿萨姆)
azeAzerbaijani(阿塞拜疆)
aze_cyrlAzerbaijani - Cyrilic(阿塞拜疆-Cyrilic)
belBelarusian(白俄罗斯)
benBengali(孟加拉)
bodTibetan(西藏)
bosBosnian(波斯尼亚)
bulBulgarian(保加利亚语)
catCatalan; Valencian(加泰罗尼亚语; 巴伦西亚)
cebCebuano(宿务)
cesCzech(捷克)
chi_simChinese - Simplified(中国-简体)
chi_traChinese - Traditional(中国-繁体)
chrCherokee(切诺基)
cymWelsh(威尔士)
danDanish(丹麦)
dan_frakDanish - Fraktur(丹麦-Fraktur)
deuGerman(德国)
deu_frakGerman - Fraktur(德国-Fraktur)
dzoDzongkha(不丹文)
ellGreek, Modern (1453-)(希腊,现代(1453-))
engEnglish(英语)
enmEnglish, Middle (1100-1500)(英语,中东(1100-1500))
epoEsperanto(世界语)
equMath / equation detection module(数学/方程式检测模块)
estEstonian(爱沙尼亚)
eusBasque(巴斯克)
fasPersian(波斯)
finFinnish(芬兰)
fraFrench(法语)
frkFrankish(法兰克)
frmFrench, Middle (ca.1400-1600)(法国,中东(ca.1400-1600))
gleIrish(爱尔兰)
glgGalician(加利西亚)
grcGreek, Ancient (to 1453)(希腊语,古(到1453年))
gujGujarati(古吉拉特语)
hatHaitian; Haitian Creole(海天; 海地克里奥尔语)
hebHebrew(希伯来语)
hinHindi(印地文)
hrvCroatian(克罗地亚)
hunHungarian(匈牙利)
ikuInuktitut(因纽特语)
indIndonesian(印尼)
islIcelandic(冰岛)
itaItalian(意大利语)
ita_oldItalian - Old(意大利语-旧)
javJavanese(爪哇)
jpnJapanese(日本)
kanKannada(卡纳达语)
katGeorgian(格鲁吉亚)
kat_oldGeorgian - Old(格鲁吉亚-旧)
kazKazakh(哈萨克斯坦)
khmCentralKhmer(中央高棉)
kirKirghiz; Kyrgyz(柯尔克孜; 吉尔吉斯)
korKorean(韩国)
kurKurdish(库尔德人)
laoLao(老挝)
latLatin(拉丁)
lavLatvian(拉脱维亚)
litLithuanian(立陶宛)
malMalayalam(马拉雅拉姆语)
marMarathi(马拉)
mkdMacedonian(马其顿)
mltMaltese(马耳他)
msaMalay(马来文)
myaBurmese(缅甸)
nepNepali(尼泊尔)
nldDutch; Flemish(荷兰; 佛兰芒语)
norNorwegian(挪威)
oriOriya(奥里亚语)
osdOrientation and script detection module(定位及脚本检测模块)
panPanjabi; Punjabi(旁遮普语; 旁遮普语)
polPolish(波兰)
porPortuguese(葡萄牙语)
pusPushto; Pashto(普什图语; 普什图语)
ronRomanian; Moldavian; Moldovan(罗马尼亚; 摩尔多瓦; 摩尔多瓦)
rusRussian(俄罗斯)
sanSanskrit(梵文)
sinSinhala; Sinhalese(僧伽罗语; 僧伽罗语)
slkSlovak(斯洛伐克)
slk_frakSlovak - Fraktur(斯洛伐克- Fraktur)
slvSlovenian(斯洛文尼亚)
spaSpanish; Castilian(西班牙语; 卡斯蒂利亚)
spa_oldSpanish; Castilian - Old(西班牙语; 卡斯蒂利亚-老)
sqiAlbanian(阿尔巴尼亚)
srpSerbian(塞尔维亚)
srp_latnSerbian - Latin(塞尔维亚语-拉丁语)
swaSwahili(斯瓦希里语)
sweSwedish(瑞典)
syrSyriac(叙利亚)
tamTamil(泰米尔)
telTelugu(泰卢固语)
tgkTajik(塔吉克斯坦)
tglTagalog(菲律宾语)
thaThai(泰国)
tirTigrinya(提格雷语)
turTurkish(土耳其)
uigUighur; Uyghur(维吾尔族; 维吾尔)
ukrUkrainian(乌克兰)
urdUrdu(乌尔都语)
uzbUzbek(乌兹别克斯坦)
uzb_cyrlUzbek - Cyrilic(乌兹别克斯坦- Cyrilic)
vieVietnamese(越南语)
yidYiddish(意第绪语)
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值