计算机视觉
计算机视觉
金融科技自习生
机器学习、数据挖掘、大数据、Python、金融科技。
展开
-
图像描述中的注意力机制
图像描述(image caption)近几年来借助深度学习端到端的训练生成方式,得到了显著的发展。总的来说图像描述一般有两种生成范式,一类是botton-up范式,一类是 top-down范式botton-up是经典的范式,这一类模型监测图像中的视觉概念、目标、属性、单词、等然后再通过语言模型将这些属性连接到一起,从而生成图像描述的句子。(像小学语文给定散乱的字词,然后造句)而...原创 2019-03-28 20:59:30 · 3865 阅读 · 0 评论 -
注意力机制在图像描述模型上的几篇论文笔记
得益于深度学习的发展,图像描述模型目前有很多非常优秀的模型和一些模型提升方法,在本文中我以注意力机制为线路,给出几篇代表性论文,以供交流。论文一:Show and Tell: A Neural Image Caption Generator(将 图像描述 视为 机器翻译 的任务)本篇论文受机器翻译模型的启发,设计了一种适用于图像描述任务的encode-decode框架,不同于机器翻译模型的...原创 2019-05-11 22:33:48 · 2593 阅读 · 0 评论 -
图像描述-Image Caption
本文大致以show attent and tell 为讲解模板。图像描述的概念,在这里就不多概述了,用通俗的话就是--看图说话。而这篇文章虽然不是现在的最优模型,但是由于第一次将注意力机制引入到图像描述的模型中来,因此它的意义非常的重要。引人了注意力机制(Attentionmechanism,)--它能够让encode-decode模型能够像人一样,重点关注图像的某一个区域进行准确的描述...原创 2019-07-31 21:01:10 · 2962 阅读 · 0 评论