attention 文字识别算法_一文带你了解文字识别

摘要:本文主要介绍文字检测和文字识别作为计算机视觉一部分的重要性,基本知识,面临的挑战,以及部分最新的成果。

人类在认识了解世界的信息中91%来自视觉,同样计算机视觉是机器认知世界的基础,也是人工智能研究的热点,文字识别也是人工智能的重要研究方向。在我们生活当中,文字是无处不在的,我们的衣食住行都是离不开它的。

文字的价值

首先,文字并非自然产生,而是人类特有的造物,是高层语义信息的载体。文字从整个文化的角度来讲也是非常重要的,人类的文明离不开文字,文字是我们学习知识、传播信息、记录思想很重要的载体,没有文字人类的文明无从谈起。比如说王羲之的“兰亭序”,不只是文化作品,也是人类历史上璀璨的明珠之一;再比如诗经,通过诗经我们既可以学习它朗朗上口的文学特性,也可以通过它了解两千年前历史的故事和先人的思想。

在上图的右侧的两幅图里面,可以看到是有建筑、有场景、有树木等。如果仅仅看到这两幅图,相信大家并不知道图片表达的意思。但是结合了文字之后,就可以一目了然的看到要讲的内容。所以说文字是计算机视觉的重要线索,与其他视觉信息有着重要的互补作用,可以和对话、NLP等,合成多模态语义分析。

光学字符识别,英文为OCR,是指把图片、PDF中的文字转换成可编辑的文字,也就是通常所说的文字识别。如果只提光学字符识别,估计很多人不知道是什么意思,所以大家通常把光学字符识别说成为文字识别。实际光学字符识别是一般包括检测和识别等多个过程。文字检测,是指判断是否存在文字实例,并给出具体位置的过

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值