一说到Tesseract-OCR就可以想到Ray smith。他研究tesseract将近30年,真的佩服。最近要用到tesseract,就顺便整理一下Ray Smith的关于Tesseract-OCR的文章。
首先是他最出名的对Tesseract-OCR的综述:
An Overview of the Tesseract OCR Engine
Tesseract-OCR的页面布局(上篇综述没有细说,我也不知道当时怎么找到的这篇文章):
Hybrid Page Layout Analysis via Tab-Stop Detection
综述里提到的直线检测算法(综述文章里也没有详细描述,他有一篇单独的文章):
A Simple and Efficient Skew Detection Algorithm via Text Row Accumulation
后续还看了别的再更新