自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 Image Cption:Curiosity-driven Reinforcement Learning for Diverse Visual Paragraph Generation

三个挑战:模式崩溃、延迟反馈、策略网络耗 这篇paper:首先通过将段落标题作为一个长期的决策过程进行建模,并将状态转换的预测不确定性作为内在奖励进行测量,该模型被激励去记忆准确但很少被发现的描述单词,而不是那些频繁使用的通用模式。这样使得我们最后生成的段落内容生动有趣;其次,由于评价的外部奖励只能在完整段落生成后有效,我们通过考虑连续动作的相关性,用视察学习法估计每一步的期望值。然后,由“...

2020-03-16 11:12:13 415

原创 Image Caption:Look Back and Predict Forward in Image Captioning全文翻译加解读

#摘要目前存在的依附注意力模型的图像标注方法大都是专注当前单词和这一步的语义信息来生成下一个单词,没有考虑视觉和语义之间的联系。我们提出了LB来嵌入之前的视觉信息并且采用PF预测将来。LB是通过调整前一单词跳到当前的注意力值变化来使其满足人类的视觉连贯性。PF模型在一个时间步长内预测下两个单词,并联合使用它们的概率进行推理。然后将这两种方法结合为LBPF,进一步整合过去的视觉信息和未来的语言信息...

2020-02-28 14:57:28 823

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除