一念深爱-CSDN博客

原创 Image Cption：Curiosity-driven Reinforcement Learning for Diverse Visual Paragraph Generation

三个挑战：模式崩溃、延迟反馈、策略网络耗这篇paper：首先通过将段落标题作为一个长期的决策过程进行建模，并将状态转换的预测不确定性作为内在奖励进行测量，该模型被激励去记忆准确但很少被发现的描述单词，而不是那些频繁使用的通用模式。这样使得我们最后生成的段落内容生动有趣；其次，由于评价的外部奖励只能在完整段落生成后有效，我们通过考虑连续动作的相关性，用视察学习法估计每一步的期望值。然后，由“...

2020-03-16 11:12:13 459

原创 Image Caption:Look Back and Predict Forward in Image Captioning全文翻译加解读

#摘要目前存在的依附注意力模型的图像标注方法大都是专注当前单词和这一步的语义信息来生成下一个单词，没有考虑视觉和语义之间的联系。我们提出了LB来嵌入之前的视觉信息并且采用PF预测将来。LB是通过调整前一单词跳到当前的注意力值变化来使其满足人类的视觉连贯性。PF模型在一个时间步长内预测下两个单词，并联合使用它们的概率进行推理。然后将这两种方法结合为LBPF，进一步整合过去的视觉信息和未来的语言信息...

2020-02-28 14:57:28 845

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人