一、文本生成相关任务
- 翻译
- 对话生成
- 自动文摘
- image2caption
二、文本生成评测指标
- BLEU
- Rouge : https://www.jianshu.com/p/0afb93fda403
- NIST
- METEOR
- TER
2.1 BLUE
2.2 Rouge
2.3 PPL困惑度
ppl是用在自然语言处理领域(NLP)中,衡量语言模型好坏的指标。它主要是根据每个词来估计一句话出现的概率,并用句子长度作normalize,公式为:
https://blog.csdn.net/shawroad88/article/details/105639148
reference
https://zhuanlan.zhihu.com/p/150057895