OCR调研

最新推荐文章于 2024-04-22 09:33:59 发布

xiaohuixiao！

最新推荐文章于 2024-04-22 09:33:59 发布

阅读量441

点赞数

分类专栏： OCR

本文链接：https://blog.csdn.net/qq_42182596/article/details/107705945

版权

本文介绍了光学字符识别（OCR）技术，重点讨论了Tesseract OCR库的使用，包括安装和识别中文的步骤。此外，还提到了通过pytesseract调用百度API进行文字识别以及利用cnstd和cnocr进行文本检测的方法。

摘要由CSDN通过智能技术生成

将图片翻译成文字一般被称为光学文字识别（Optical Character Recognition，OCR）。可以实现OCR 的底层库并不多，目前很多库都是使用共同的几个底层OCR 库，或者是在上面进行定制。
Tesseract 是一个OCR 库，目前由Google 赞助（Google 也是一家以OCR 和机器学习技术闻名于世的公司）。Tesseract 是目前公认最优秀、最精确的开源OCR 系统。
除了极高的精确度，Tesseract 也具有很高的灵活性。它可以通过训练识别出任何字体（只要这些字体的风格保持不变就可以），也可以识别出任何Unicode 字符。

tesseract步骤：

1、brew install tesseract
在这里插入图片描述
2、tesseract --version

3、想要识别中文就要下载简体中文库：chi_sim.traineddata
下载后拖入 /usr/local/share/tessdata文件夹内(Mac)
4、tesseract -l chi_sim saomiao.png result
saomiao.png ：识别的图片位置
result：存入的result位置