基于python的OCR中文字符识别

最新推荐文章于 2024-08-03 15:35:50 发布

suhuigui

最新推荐文章于 2024-08-03 15:35:50 发布

阅读量925

点赞数

文章标签： python ocr

本文链接：https://blog.csdn.net/suhuigui/article/details/108493030

版权

基于python的OCR中文字符识别

OCR与Tesseract介绍
- 安装Tesseract

OCR与Tesseract介绍

将图片翻译成文字一般被称为光学文字识别（Optical Character Recognition，OCR）。可以实现OCR 的底层库并不多，目前很多库都是使用共同的几个底层OCR 库，或者是在上面进行定制。
Tesseract 是一个OCR 库，目前由Google 赞助（Google 也是一家以OCR 和机器学习技术闻名于世的公司）。Tesseract 是目前公认最优秀、最精确的开源OCR 系统。
除了极高的精确度，Tesseract 也具有很高的灵活性。它可以通过训练识别出任何字体（只要这些字体的风格保持不变就可以），也可以识别出任何Unicode 字符。