2018-10-29 - V4.0.0
1、增加了新的基于LSTM的神经网络系统,提高了系统的精度。
2、PDF渲染的改进
3、修复训练数据呈现
4、将LSTM模型+lang模型添加到101种语言中。(tessdata存储库)
5、改进的多页TIFF处理
6、修正了处理PDF时对二值图像的损伤
7、修正训练过程,允许从识别模型中进行增量训练
8、使LSTM成为默认引擎,推出多维数据集
9、已更改的OEMode——传统tesseract引擎的oem 0,LSTM的oem 1,二者的oem 2,缺省情况下的oem 3
10、避免使用Leptonica调试参数或函数
11、固定多语言模式
12、删除了对VS2010的支持
13、增加了对VS2015和VS2017的CPPAN支持
14、只针对PDF实现的不可见文本
15、增加了对windows系统的AVX / SSE 支持
16、启用OpenMP支持
17、参数unlv_tilde_cru.ng更改为false
18、杂项修正
手动翻译,如有错误,还请下方评论区修正,多谢