openCV和OCR的简单介绍

openCV是一个跨平台的计算机视觉库,主要是用于开发实时的图像处理、计算机视觉以及模式识别程序。Ocr简单来说就是通过检测暗亮的模式确定其形状,然后通过字符识别的方法将形状翻译成计算机文字的过程。

   主要的代码步骤:1,先配置了NDK环境2,加载训练的结果

   2,进行图像的查找,将java层的bitmap转为openCV可以识别的Mat数据。

   3,进行图像处理。如何识别图像呢?先将图像转变成灰色图像,将这个灰色图像进行二值化,接着讲二值化的图   片再进行高斯滤波,最后将图片进行canny边缘检测.

   4,进行图像的匹配,采用归一化处理,最后通过归一的结果来获取你想获取的区域。


  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
OpenCV(Open Source Computer Vision Library)是一款开源的计算机视觉库,专门为图像和视频处理任务设计,广泛应用于学术研究、工业应用以及个人项目中。以下是关于OpenCV的详细介绍: 历史与发展 起源:OpenCV于1999年由英特尔公司发起,旨在促进计算机视觉技术的普及和商业化应用。该项目旨在创建一个易于使用、高效且跨平台的库,为开发者提供实现计算机视觉算法所需的基础工具。 社区与支持:随着时间的推移,OpenCV吸引了全球众多开发者和研究人员的参与,形成了活跃的社区。目前,OpenCV由非盈利组织OpenCV.org维护,并得到了全球开发者、研究机构以及企业的持续贡献和支持。 主要特点 跨平台:OpenCV支持多种操作系统,包括但不限于Windows、Linux、macOS、Android和iOS,确保代码能够在不同平台上无缝运行。 丰富的功能:库中包含了数千个优化过的函数,涵盖了计算机视觉领域的诸多方面,如图像处理(滤波、形态学操作、色彩空间转换等)、特征检测与描述(如SIFT、SURF、ORB等)、物体识别与检测(如Haar级联分类器、HOG、DNN等)、视频分析、相机校正、立体视觉、机器学习(SVM、KNN、决策树等)、深度学习(基于TensorFlow、PyTorch后端的模型加载与部署)等。 高效性能:OpenCV代码经过高度优化,能够利用多核CPU、GPU以及特定硬件加速(如Intel IPP、OpenCL等),实现高速图像处理和实时计算机视觉应用。 多语言支持:尽管OpenCV主要使用C++编写,但它提供了丰富的API绑定,支持包括C、Python、Java、MATLAB、JavaScript等多种编程语言,方便不同领域的开发者使用。 开源与免费:OpenCV遵循BSD开源许可证发布,用户可以免费下载、使用、修改和分发库及其源代码,无需担心版权问题。 架构与核心模块 OpenCV的架构围绕核心模块构建,这些模块提供了不同层次的功能: Core:包含基本的数据结构(如cv::Mat用于图像存储和操作)、基本的图像和矩阵操作、数学函数、文件I/O等底层功能。 ImgProc:提供图像预处理、滤波、几何变换、形态学操作、直方图计算、轮廓发现与分析等图像处理功能。 HighGui:提供图形用户界面(GUI)支持,如图像和视频的显示、用户交互(如鼠标事件处理)以及简单的窗口管理。 VideoIO:负责视频的读写操作,支持多种视频格式和捕获设备。 Objdetect:包含预训练的对象检测模型(如Haar级联分类器用于人脸检测)。 Features2D:提供特征点检测(如SIFT、ORB)与描述符计算、特征匹配与对应关系估计等功能。 Calib3d:用于相机标定、立体视觉、多视图几何等问题。 ML:包含传统机器学习算法,如支持向量机(SVM)、K近邻(KNN)、决策树等。 DNN:深度神经网络模块,支持导入和运行预训练的深度学习模型,如卷积神经网络(CNN)。
OpenCV原生OCR是指使用OpenCV库来实现OCR(Optical Character Recognition,光学字符识别)功能的方法。OpenCV是一个开源的计算机视觉库,拥有丰富的图像处理和计算机视觉算法,可以用于图像分析、目标检测和识别等任务。 在使用OpenCV原生OCR时,我们主要利用其图像处理和特征提取的功能。首先,通过OpenCV提供的图像预处理方法,如灰度化、二值化、滤波等,将输入图像准备好。然后,我们可以利用一些OCR算法,如基于模板匹配、特征提取和机器学习的方法,对图像中的字符进行识别。 OpenCV原生OCR包括以下几个步骤: 1. 图像预处理:将彩色图像转化为灰度图像,并进行降噪处理,以提高字符识别的准确性。 2. 字符分割:将图像中的字符分割为单个的字符区域,以便后续的识别处理。 3. 特征提取:对每个字符区域提取其特征,如形状、纹理、边缘等信息,以便进行字符匹配。 4. 字符识别:通过比对抽取的特征与预定义的字符模板或训练好的模型进行匹配,从而实现字符的识别和分类。 5. 结果输出:将识别出的字符结果输出为文本或存储到数据库等。 需要注意的是,OpenCV原生OCR的效果受到图像质量、字符字体、字体大小等多个因素的影响。因此,在实际应用中,我们可能需要根据具体情况对算法进行调优,或者结合其他技术如图像增强、机器学习等来进一步提高OCR的准确性。 总的来说,OpenCV原生OCR是一种简单而有效的实现OCR功能的方法,通过利用OpenCV库中的图像处理和特征提取功能,可以实现对图像中的字符进行准确识别。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值