计算机视觉注意力机制应用

attention—OCR
首先同样学习一门技术的同时学习背后的历史,计算机是非常讲究实现性科学。所以我们必须研究历史来完善技术的演化便于我们理解和仍然存在的技术问题进行论证。
最早成大脑成像机制winner-take-all的建模方法来实现这个过程,那么怎么可以使得计算机拥有自主学习注意力的机制那么我们就要研究神经网络的图像的机制,我个人非常讨厌现在很多书没有解释说明数字图像,虽然很多书都有对图像概念性描述,但是图像的表示,图像的知识表示我只在一本比较旧的书看到过,很多书没有对位图、矢量图、索引图相关技术细节做深入研究知识,如果工程基础好这些在项目中可以反推,但是我估计很多书的作者都不会这么干。
软注意力问题,通过滤波器的通道关注区域,这个在感受视野和RPN及ROI都有很好体现,这种网络生产的关键区域书可以微分的,通过微分的注意力可以传个神经网络技术梯度并且反省传播利用范数的方案指导这种反馈来学习注意力权重。
强注意力问题是关注于焦点或角点来衍射一个区域更加注重变换和动态性和随机的预测过程,强注意力过程不可微分的注意力,因此可以考虑差分办法来解决问题缺陷实现增强,也有人用reinforcement learning方法来完成这项工作。
https://github.com/da03/Attention-OCR
今天有点累了 ,改天再写

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值