opencv ocr字符识别_OCR文字识别原理

本文详细介绍了OCR文字识别原理,包括预处理(灰度化、二值化、降噪、倾斜矫正)、图片分割和最后的文字识别。通过OpenCV进行图像处理,使用Tesseract进行文字识别,虽然对中文识别速度有限,但提供了对文档识别的基础流程理解。
摘要由CSDN通过智能技术生成

OCR文字识别原理

首先介绍一个名词OCR(Optical Character Recognition,光学字符识别)。是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。

OCR的应用领域:

文字识别OCR通常应用在证件识别(身份证,驾驶证,护照,名片)、文档检索、截图识别(猿题库,作业帮)

OCR对图片都做了什么:

实际上我们预期的结果是把只有包含单个文字的图片交给计算机去翻译。
机器是怎么看到纸质或者电子文档或是图片上的文字的呢?接下来看一下他的工作流程:
首先要去掉杂质,这样程序就可以集中注意到文字上面。

预处理

预处理主要包括灰度化,二值化,噪声去除,倾斜矫正等。

  1. 灰度化:
    灰度图是只含亮度信息,不含色彩信息的图片。
    在RGB模型中,如果R=G=B时,则彩色表示一种灰度颜色,其中R=G=B的值叫灰度值。
    一般满足下面这个公式:
    Gray=0.299R+

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值