开启OCR的博客共享世界

人工智能正在向纵深发展,所有的AI人都在努力的让计算机、机器解决人类生活和工作中的问题。而在这过程中,深度学习算法让计算机、机器人有了自我学习的能力。海量的数据输入为深度学习大脑,深度学习大脑从数据中大量汲取养分。百度大脑作为深度学习的代表作,目前的智力已经可以达到2-3岁孩子的水平,甚至在某些方面的能力已经超越人类。前不久的利用谷歌大脑开发的AlphaGo与李世石的围棋大战让越来越多的人了解了深度学习,了解了人工智能技术的进步。

海量的网络资源终究无法替代现实生活场景,如何让深度学习大脑更懂这个世界?

答案就是——让深度学习的大脑到生活中去。在生活中探索和学习。作为计算机,它要怎么才能进入人类的世界呢?入口在哪里?机器视觉、语音输入……

机器视觉和语音输入等方面都为计算机提供了有效的数据入口,这也是为何目前人脸识别OCR识别语音识别等领域在深度学习领域走在技术最前沿的重要原因。入口很重要。

从出生到死亡,在这短暂又漫长的周期里人类要经历包括生活技能的学习,书本知识的学习,经验的积累等等。计算机在深度学习的帮助下,有了自己的思维能力,它掌握了一定的生活技能,现在它已经进入了2.0的阶段。快速的书本学习和经验积累。

书本知识的学习

什么是OCR,即光学字符识别技术。人类社会经过几千年的经验积累,并将这些经验大量的编纂在书籍。要让计算机从这些书籍中获取到信息,关键的一步就是图片信息文字化。OCR技术就是完成这一步骤的工作。通过扫描或拍照的方式,将书本信息采集成图片,利用OCR识别出书本信息,最后将这些信息输入到深度学习大脑中。

现实生活经验积累

在现实生活中,马路上、走道,大量的广告牌、路标、指引信息等。这些自然场景下的字符要让计算机进行学习同样需要用到OCR技术。自然场景下的OCR技术目前还处于较为初级的阶段。如何在自然场景下有效的定位到文本信息。如何对复杂环境下,将定位到的文本图片向文本文字转化。作为科技的巨头——微软,一直致力于自然场景下的OCR识别,并取得了较大的突破。

OCR识别现状

当前,OCR主要应用还集中在书本或证件等层面,这些材料具有文本清晰、字体统一等诸多特点。但是,却是日常生活中最常使用到的。市场上身份证识别、驾驶证识别、行驶证识别、银行卡识别、文档识别、票据识别等这些都是OCR带来的生活和工作便捷的重要体现。

相信,随着行业发展的不断深入。OCR一定会为人们带来越来越多的惊喜。

 

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值