第四十六周学习笔记

最新推荐文章于 2024-04-24 16:18:31 发布

luputo

最新推荐文章于 2024-04-24 16:18:31 发布

阅读量360

点赞数

分类专栏：学习笔记

本文链接：https://blog.csdn.net/luo3300612/article/details/93238259

版权

61 篇文章 3 订阅

订阅专栏

Exact Adversarial Attack to Image Captioning via Structured Output Learning with Latent Variables，本文提出了一种欺骗CNN+RNN的image caption模型的方法，将问题形式化为生成结构化输出的学习问题，使用了两个不同的criterion来进行优化
MSCap: Multi-Style Image Captioning with Unpaired Stylized Text，本文使用unpaired的数据训练了一个能够生成多个style的Image caption模型
Self-critical n-step Training for Image Captioning，本文reformulate了image caption的优势函数，并提出了n-step的优势函数
Look Back and Predict Forward in Image Captioning，本文提出了Look Back来利用之前的attention信息，以及Predict Forward来预测以后的词，其动机来源于object与seq的一对多关系以及attention与seq的一对一关系的矛盾性
Intention Oriented Image Captions with Guiding Objects，本文提出了CGO来进行object guided image caption，以图片和期望的object词作为输入，模型可以生成包括object的caption，这个过程是由LSTM-L和LSTM-R分别从Object词两边生成句子完成的