对image caption任务做evaluation（计算Bleu1，Bleu2，Bleu3，Bleu4，METEOR，ROUGE_L，CIDEr）

最新推荐文章于 2024-04-02 15:04:09 发布

xiyou__

最新推荐文章于 2024-04-02 15:04:09 发布

阅读量1.3k

点赞数 1

分类专栏：数据处理文章标签： python

本文链接：https://blog.csdn.net/xiyou__/article/details/121494013

版权

数据处理专栏收录该内容

13 篇文章 2 订阅

订阅专栏

用到一两个image caption任务的模型，模型中没有给出性能评估的方法，于是在github上找到了一个能够评估image caption的模型，该模型能够帮助计算常见的评价指标的结果，包括Bleu1，Bleu2，Bleu3，Bleu4，METEOR，ROUGE_L，CIDEr，SkipThoughtsCosineSimilarity，EmbeddingAverageCosineSimilarity，VectorExtremaCosineSimilarity，GreedyMatchingScore。
github地址：点击链接

依照github上的要求一步步安装后，在nlg-eval-master根目录上导入result.txt（生成的caption），caption1.txt（caption的标准结果1），caption2.txt（caption的标准结果2），caption3.txt（caption的标准结果3），caption4.txt（caption的标准结果4），caption5.txt（caption的标准结果5），并创建文件evaluation.py：

import nlgeval
res=nlgeval.compute_metrics(hypothesis='./result.txt',
                   references=['./caption1.txt','./caption2.txt','./caption3.txt','./caption4.txt','./caption5.txt'])
print(res)

就会得到各评价指标的结果。

xiyou__

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
对image caption任务做evaluation（计算Bleu1，Bleu2，Bleu3，Bleu4，METEOR，ROUGE_L，CIDEr）

用到一两个image caption任务的模型，模型中没有给出性能评估的方法，于是在github上找到了一个能够评估image caption的模型，该模型能够提供常见的评价指标的结果，包括Bleu1，Bleu2，Bleu3，Bleu4，METEOR，ROUGE_L，CIDEr，SkipThoughtsCosineSimilarity，EmbeddingAverageCosineSimilarity，VectorExtremaCosineSimilarity，GreedyMatchingScore。git
复制链接

扫一扫

专栏目录