- 博客(2)
- 收藏
- 关注
原创 读书笔记--《Show and Tell: A Neural Image Caption Generator》
这篇文章设计了一个端到端的网络来解决image caption问题,这个模型将最先进的视觉和语言模型结合在了一起,从而在效果上取得了巨大的进展。 这篇文章提出了一个神经和概率框架来对图像生成描述,模型利用循环神经网络将可变长度的输入编码变成固定长度的编码并且用这种方式将其解码成期望输出的句子。 通过最小化这个函数来获得图片的正确描述 这个网络选用了LS
2017-11-05 11:41:00 859
原创 读书笔记---Explain Images with Multimodal Recurrent Neural Networks
之前的方法将image caption任务看成检索任务,对句子和图像提取特征,并将他们映射到相同的语义嵌入空间,只能对数据集中已经存在的图像进行注释,不能描述先前看不到的对象和场景。 这篇文章提出了一个多模式递归神经网络模型(m-RNN)用于解释图像的内容。这个模型根据已经给出的图片和之前生成的单词来预测下一个单词。m-RNN主要是由两个子网络组成的:用于句子的深度递归网络和用于图像的
2017-11-03 22:26:03 1222 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人