《Good News, Everyone! Context driven entity-aware captioning for news images》笔记

最新推荐文章于 2022-09-05 17:10:36 发布

王权大宝

最新推荐文章于 2022-09-05 17:10:36 发布

阅读量511

点赞数 1

分类专栏：论文笔记文章标签：论文笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_29396337/article/details/97393592

版权

论文笔记专栏收录该内容

13 篇文章 0 订阅

订阅专栏

这篇文章能够利用与图像相关的新闻文章的文本来提供上下文信息。这个模型能够有选择的从由视觉线索引导的文章中提取信息，并且动态的将输出字典拓展到出现在上下文源中的词典外的命名实体。同时作者还提出了一个新闻图像描述数据集“GoodNews”。

用于上下文驱动的实体感知描述的模型由两个连续阶段组成：(1)输入图像和对应的新闻文本，生成一个句子模板，其中占位符用来指示命名实体的位置；(2)在整个文章上的注意力机制下，选择正确的命名实体实体填充占位符。

生成描述模板。对于要生成的句子:

其中，表示注意的文章特征，表示注意的图像特征

基于注意力编码文章。第i个文章的句子层级的特征,其中是文章中的第j个句子，是从预训练的GloVe模型获得的词向量。首先对文章的每个句子用一个简单的单词平均：

作为替代方案，还可以根据平滑的逆频率使用单词向量的加权平均值，因为词向量在语义无意义的方向上有巨大的分量：

还可以使用TBB方法，从文章编码的加权平均值中减去PCA的第一个组成部分，因为根据经验，数据集的顶部奇异向量似乎难以对应句法信息或常用词：

获得句子层级的特征,M是固定的句子长度，Dw是词向量的维度。设计一个注意力机制:

用一个全连接层学习注意力。

除了改进描述模板的生成，注意力的使用使得模型能够在注意力向量的基础上选择正确的命名实体。

插入命名实体。为了将该方法与标准的图像描述模型进行比较，作者提出了三种方法，其中前两种架构不考虑文章的文本特征：

(1)随机插入。从文章中随机选择tag同个类别下的命名实体。

(2)基于文本的插入。根据生成的模板描述的嵌入，利用预训练的GloVe嵌入的余弦相似性来排序文章的句子。然后在排序的基础上插入命名实体。

(3)基于文章上的注意力机制插入。用在模板描述生成中产生的βt来插入命名实体，不使用额外的插入方法。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

王权大宝 CSDN认证博客专家 CSDN认证企业博客

码龄9年

24: 原创

14万+: 周排名

133万+: 总排名

4万+: 访问

: 等级

558: 积分

17: 粉丝

39: 获赞

18: 评论

173: 收藏

私信

关注

分类专栏

最新评论

琐碎笔记记录
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
PDF默认打开方式总是被Edge篡改
云朵伴星星: 没用啊每次开机都是edge 不是wps
PDF默认打开方式总是被Edge篡改
cloudsfans: 试试题主说的方法
PDF默认打开方式总是被Edge篡改
CSDN-Ada助手: 非常感谢博主分享关于PDF默认打开方式的问题，我觉得这是一个非常实用的技巧。接下来，我建议你可以继续写一篇关于Windows系统中常见文件类型默认打开方式的设置技巧，例如如何设置默认的浏览器、音乐播放器等。相信这样的技术文章对其他用户也非常有帮助，期待你的下一篇博客！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
联想拯救者Y7000P2019双系统安装与卸载（win10+ubuntu18.04+NVIDIA GeForce RTX2060+CUDA10.0+Cudnn+pytorch）
dmo123: 可以了可以了，没用管理员身份打开刚刚

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。