开启OCR的博客共享世界

最新推荐文章于 2022-06-03 17:05:51 发布

ocrclub

最新推荐文章于 2022-06-03 17:05:51 发布

阅读量433

点赞数 1

分类专栏：深度学习文章标签： OCR识别人工智能机器视觉深度学习科技

本文链接：https://blog.csdn.net/ocrclub/article/details/53289020

版权

深度学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

人工智能正在向纵深发展，所有的AI人都在努力的让计算机、机器解决人类生活和工作中的问题。而在这过程中，深度学习算法让计算机、机器人有了自我学习的能力。海量的数据输入为深度学习大脑，深度学习大脑从数据中大量汲取养分。百度大脑作为深度学习的代表作，目前的智力已经可以达到2-3岁孩子的水平，甚至在某些方面的能力已经超越人类。前不久的利用谷歌大脑开发的AlphaGo与李世石的围棋大战让越来越多的人了解了深度学习，了解了人工智能技术的进步。

海量的网络资源终究无法替代现实生活场景，如何让深度学习大脑更懂这个世界？

答案就是——让深度学习的大脑到生活中去。在生活中探索和学习。作为计算机，它要怎么才能进入人类的世界呢？入口在哪里？机器视觉、语音输入……

机器视觉和语音输入等方面都为计算机提供了有效的数据入口，这也是为何目前人脸识别、OCR识别、语音识别等领域在深度学习领域走在技术最前沿的重要原因。入口很重要。

从出生到死亡，在这短暂又漫长的周期里人类要经历包括生活技能的学习，书本知识的学习，经验的积累等等。计算机在深度学习的帮助下，有了自己的思维能力，它掌握了一定的生活技能，现在它已经进入了2.0的阶段。快速的书本学习和经验积累。

书本知识的学习

什么是OCR，即光学字符识别技术。人类社会经过几千年的经验积累，并将这些经验大量的编纂在书籍。要让计算机从这些书籍中获取到信息，关键的一步就是图片信息文字化。OCR技术就是完成这一步骤的工作。通过扫描或拍照的方式，将书本信息采集成图片，利用OCR识别出书本信息，最后将这些信息输入到深度学习大脑中。

现实生活经验积累

在现实生活中，马路上、走道，大量的广告牌、路标、指引信息等。这些自然场景下的字符要让计算机进行学习同样需要用到OCR技术。自然场景下的OCR技术目前还处于较为初级的阶段。如何在自然场景下有效的定位到文本信息。如何对复杂环境下，将定位到的文本图片向文本文字转化。作为科技的巨头——微软，一直致力于自然场景下的OCR识别，并取得了较大的突破。

OCR识别现状

当前，OCR主要应用还集中在书本或证件等层面，这些材料具有文本清晰、字体统一等诸多特点。但是，却是日常生活中最常使用到的。市场上身份证识别、驾驶证识别、行驶证识别、银行卡识别、文档识别、票据识别等这些都是OCR带来的生活和工作便捷的重要体现。

相信，随着行业发展的不断深入。OCR一定会为人们带来越来越多的惊喜。

ocrclub

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
开启OCR的博客共享世界

从出生到死亡，在这短暂又漫长的周期里人类要经历包括生活技能的学习，书本知识的学习，经验的积累等等。计算机在深度学习的帮助下，有了自己的思维能力，它掌握了一定的生活技能，现在它已经进入了2.0的阶段。快速的书本学习和经验积累。
复制链接

扫一扫