【名词解释】ImageCaption任务中的CIDEr、n-gram、TF-IDF、BLEU、METEOR、ROUGE 分别是什么？它们是怎样计算的？

页页读

已于 2024-04-26 10:59:40 修改

阅读量2.1k

点赞数 16

分类专栏：多模态模型 NLP 文章标签：多模态模型

于 2024-04-02 15:04:09 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014386899/article/details/137270810

版权

CIDEr

CIDEr（Consensus-based Image Description Evaluation）是一种用于自动评估图像描述（image captioning）任务性能的指标。它主要通过计算生成的描述与一组参考描述之间的相似性来评估图像描述的质量。CIDEr的独特之处在于它考虑了人类对图像描述的共识，尝试捕捉描述的自然性和信息量。

CIDEr的计算过程

CIDEr的计算可以分为以下几个步骤：

词干提取：首先，对所有的参考描述和候选描述进行分词，然后将分词后的结果转化为它们的词干形式，以减少单词的变形对评分的影响。
TF-IDF权重计算：为了让常见词（如“the”，“is”等）的权重降低而让稀有词的权重提高，CIDEr使用TF-IDF（词频-逆文档频率）来计算每个词的权重。这一步骤的目的是提高描述中独特、信息丰富词汇的权重。
n-gram相似度计算：CIDEr通过计算候选描述和参考描述间n-gram（n可以从1到某个最大值，常用的是4）的余弦相似度来评估它们的相似性。这些n-gram的权重由第二步中计算的TF-IDF值决定。
相似度打分汇总：将上一步骤中计算出的所有n-gram相似度汇总，得到一个总体的相似度得分。通常，这个得分会对不同长度的n-gram给予不同的权重，以平衡信息量和流畅度。
归一化：最后，为了消除不同数据集之间评分的差异，CIDEr得分通常会经过归一化处理。

计算公式

CIDEr的计算可以用下面的公式表示：

$\text{CIDEr} = \sum_{n=1}^{N} w_n \cdot \frac{1}{m} \sum_{j=1}^{m} \frac{\sum_{i} \min(g_i^{(n)}, r_{ij}^{(n)})}{\sqrt{\sum_{i} (g_i^{(n)})^2} \cdot \sqrt{\sum_{i} (r_{ij}^{(n)})^2}}$

其中：

$N$ 是n-gram的最大长度。
$w_n$ 是n-gram长度为 $n$ 的权重，通常为1。
$m$ 是参考描述的数量。
$g_i^{(n)}$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。