一、基于tesseract_OCR+opencv实现图片中汉字辨识-汉字笔画优化
https://blog.csdn.net/lipc_/article/details/80812258
二、基于Tesseract实现图片文字识别-表格采用单元格识别优化
https://www.cnblogs.com/yszd/p/12072145.html
三、基于tesseract_OCR优化-白名单方法
https://support.i-search.com.cn/article/1543308767112
四、pytesseract识别中文并获得中文的位置信息