tesseract-ocr 4.0.0升级说明

2018-10-29 - V4.0.0

1、增加了新的基于LSTM的神经网络系统,提高了系统的精度。

2、PDF渲染的改进

3、修复训练数据呈现

4、将LSTM模型+lang模型添加到101种语言中。(tessdata存储库)

5、改进的多页TIFF处理

6、修正了处理PDF时对二值图像的损伤

7、修正训练过程,允许从识别模型中进行增量训练

8、使LSTM成为默认引擎,推出多维数据集

9、已更改的OEMode——传统tesseract引擎的oem 0,LSTM的oem 1,二者的oem 2,缺省情况下的oem 3

10、避免使用Leptonica调试参数或函数

11、固定多语言模式

12、删除了对VS2010的支持

13、增加了对VS2015和VS2017的CPPAN支持

14、只针对PDF实现的不可见文本

15、增加了对windows系统的AVX / SSE 支持

16、启用OpenMP支持

17、参数unlv_tilde_cru.ng更改为false

18、杂项修正

 

手动翻译,如有错误,还请下方评论区修正,多谢

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值