字符检测专题第一期：OCR技术工业应用浅谈

Microvision维视智造

于 2023-09-11 16:44:07 发布

阅读量217

点赞数

文章标签： ocr 人工智能字符识别视觉检测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45547190/article/details/132812415

版权

难题不会做？扫一扫，题目、解析立马出现。寄快递需要输入信息？扫一扫，软件自动提取上传。身份证信息需要录入？扫一扫，立马精准识别。这些都是我们日常司空见惯的动作，而实现这一切正是得益于OCR技术。

OCR通过图像处理和模式识别技术对光学的字符进行识别，是一种能够将文字自动识别录入到电脑中的软件技术。在工业领域，光学字符识别（OCR）是一项机器视觉任务。

一、OCR字符识别技术步骤

图像预处理

图像预处理一般包括二值化、文字定位和倾斜校正等步骤。二值化将三原色构成的多色图像转换成单色图像，这就是预处理的第一步，其目的是减少冗余信息量，加快速度。倾斜校正是指对倾斜的文本完成校正。

字符分割

对预处理后的图像进行字符定位和分割操作，经过切分处理后，才能方便对单个文字进行识别处理。它是OCR中的一个重要步骤，其效果直接影响 OCR 的最终结果。

特征提取

从单个字符图像上提取统计特征或结构特征，并从已有的特征库中找到与待识别文字相似度最高的文字进行比对、匹配。传统的特征提取方法，如模板匹配和结构分析等，面对复杂字符时并不是非常有效，而且会耗费大量时间。深度学习可以轻易完成这项任务，只要拥有足够量的数据集，就能提供更精确的识别。

字符识别

在识别结果基础上根据语种的语言模型进行识别校正。

结果输出

二、OCR识别检测技术的复杂应用

在工业领域，OCR技术被普遍应用在食药品、新能源、3C电子、汽车制造、烟草等行业，实现生产日期、批号、产品编号等信息的自动识别。几乎所有的工业产品上都会印有字符，这是产品的“身份证”。而产品的外观由于字符在印刷时产生的瑕疵、错误等就会引起客户对厂商的投诉。

传统的字符识别应用场景相对固定、字体单一规范、识别率较高。但面对并不理想的环境或复杂字符：字符组合的复杂性、字符印刷材质及工艺的多样性、生产过程中产生的多类字符缺损等检测难题，业内的综合识别率只有90%甚至更低，这样的识别率远远达不到实际应用的需求。

解决此类难题就需要使用AI视觉字符识别技术对产品上的字符进行高精度、高效率、高稳定的实时检测，分析判断其是否合格。AI视觉字符识别技术不仅能快速提升流水线的检测速度和精度，更能降低人工成本、提升产量质量。

复杂字符组合

包含中文、英文、数字、特殊符号、专业单位、二维码、条形码等复杂字符内容。

字符印刷材质、工艺多样

纸板、塑料、金属、玻璃、锡纸等印刷材质及烫印、击凸、丝印、喷码、镭射等工艺的不同导致字符印刷质量存在差异。

字符缺损

字符印刷中导致的墨点、异物、文字残缺、漏印、色差、字符粘连、脏点、刀丝、拖墨、划伤、溢胶、气泡、模糊、扭曲、污渍等。

维视智造VisionBank AI 深度通用字符识别技术，在VisionBank AI的高效架构之上，延续了操作简单的图形化开发方式，基于深度学习算法的技术加持，为用户带来了更智能、更便捷的使用体验。

如何破解复杂工业环境下的识别难点，让万千字符识别难题，仅需一套视觉系统就能高效完成？下期内容为大家揭晓~

Microvision维视智造

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
字符检测专题第一期：OCR技术工业应用浅谈

在工业领域，OCR技术被普遍应用在食药品、新能源、3C电子、汽车制造、烟草等行业，实现生产日期、批号、产品编号等信息的自动识别。而产品的外观由于字符在印刷时产生的瑕疵、错误等就会引起客户对厂商的投诉。字符印刷中导致的墨点、异物、文字残缺、漏印、色差、字符粘连、脏点、刀丝、拖墨、划伤、溢胶、气泡、模糊、扭曲、污渍等。纸板、塑料、金属、玻璃、锡纸等印刷材质及烫印、击凸、丝印、喷码、镭射等工艺的不同导致字符印刷质量存在差异。包含中文、英文、数字、特殊符号、专业单位、二维码、条形码等复杂字符内容。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。