tesseract
FL1623863129
计算机应用软件开发,长期致力于研究图像算法,人工智能算法,边缘部署,算法落地研究
展开
-
[tesseract]用jTessBoxEditor制作训练库
做课题的时候,用进行字符识别时,有官方提供的字库,但这些字库并不能满足我们所有的需求,例如手写字体以及一些其他的字体。tesseract提供的字库中没有我们相应的字体时,就会出现识别错误的问题,这个时候就需要训练自己的字库进行训练了。原创 2024-05-07 14:26:39 · 1364 阅读 · 0 评论 -
[C++][windows]tesseract5.2安装后测试代码
【代码】[C++][windows]tesseract5.2安装后测试代码。原创 2023-08-17 15:55:32 · 174 阅读 · 0 评论 -
[windows][tesseract]vcpkg安装tesseract遇到的问题解决
目前发现有3个文件过期失效需要手动更改,更换版本最好失效接近,不要太新就行。certutil -hashfile 文件路径 hash512。原创 2023-08-17 15:37:24 · 254 阅读 · 0 评论 -
[tesseract-ocr][原创]win7上训练tesseract提示read_params_file: Can‘t open lstm.train
如果你在windows10及其以上版本是没问题的,但是换到win7就不行了,这个可能win7环境变量和win10环境变量搜索规则不一样导致,我们只需要在win7环境变量添加以下目录。注意上面目录要和你实际目录对应起来,我使用的是Tesseract-OCR5.0.1版本。原创 2023-05-07 08:41:26 · 386 阅读 · 0 评论 -
[tesseract-ocr][原创]tesseract训练lstm模型报错:LSTM: Training - Error msg - Encoding of string failed!
其实上面意思归根到底是你训练的数据集里面不在字符集里面,由于是finetune模型一般是不需要自己做字符集,这就导致使用字符集刚好不包含你自定义的字符集,一般会忽略这种字符,不会使得训练受到影响,但是会导致你无法识别出来,因此我们可以在训练时候指定字符集。原创 2022-08-24 11:44:04 · 681 阅读 · 0 评论 -
Tesseract-OCR5.0 Lstm傻瓜式训练工具使用教程
tesseract ocr训练需要输入很多指令而且不了解指令前提下很难训练甚至训练不起来,由于对于入门的小白或者想刚入门想要完成训练任务就很困难,为了解决训练困难问题,两款tesseract ocr快速训练工具横空出世,具体教程可以参考:tesseract ocr快速训练助手使用教程:tesseract-ocr快速训练助手_哔哩哔哩_bilibilitesseract ocr lstm版本快速训练助手使用教程:tesseract-ocr-lstm快速训练工具使用教程_哔哩哔哩_b原创 2022-05-01 17:51:51 · 5295 阅读 · 0 评论 -
[tesseract][原创]tesseract中text2image.exe转换后用jTessBoxEditor打开校正时候显示方块
当我使用下面命令转换txt为图像时候text2image --text charset.txt --outputbase ./ch.simhei.exp0 --fonts_dir ./font --font="simhei" --fontconfig_tmpdir ./tmp --writing_mode horizontal --strip_unrenderable_words用jTessBoxEditor打开显示中文全部是方块!纠结好长时间最终发现只需要设置即可具体为Setting---原创 2022-04-29 19:53:03 · 465 阅读 · 0 评论 -
[tesseract][转载]text2image命令行使用教程
NAMEtext2image - generate OCR training pages.SYNOPSIStext2image--textFILE--outputbasePATH--fonts_dirPATH[OPTION]DESCRIPTIONtext2image(1) generates OCR training pages. Given a text file it outputs an image with a given font and degradation....原创 2022-04-28 07:50:46 · 1411 阅读 · 0 评论