文本生成
文章平均质量分 71
尽量不躺平的kayla
这个作者很懒,什么都没留下…
展开
-
【文本生成】评价指标:事实一致性Evaluating the Factual Consistency of Abstractive Text Summarization
论文:2019年《Evaluating the Factual Consistency of Abstractive Text Summarization》https://arxiv.org/pdf/1910.12840.pdfmotivation高达30%的摘要是和原文事实不符的,到目前为止也没有非常好的办法去解决摘要与原文的事实一致性。introduction与事实一致的问题与两个问题最为接近:一个是natural language inference(NLI),一个是fact checkin原创 2021-12-02 19:34:22 · 2068 阅读 · 0 评论 -
【文本生成】评价指标:BARTScore
这篇论文出自2021 NeurIPS,通讯作者是卡耐基梅隆大学博士后刘鹏飞(prompt综述作者),论文全名:《BARTSCORE:Evaluating Generated Text as Text Generation》BARTSCORE采用无监督学习 对不同方面 (e.g. informativeness, fluency, or factuality) 进行评估。在本文中,我们将生成文本的评估公式化为文本生成问题,通过从其他文本输入和输出生成或生成其他文本输入和输出的概率的概率直接评估文本。这与原创 2021-10-11 14:48:38 · 4007 阅读 · 6 评论 -
【文本生成】评价指标:BERTScore
BERTScore使用contextual embedding来描述句子,计算两个句子之间的相似度。在本文中,我们将重点放在句子级别的生成评估上,并提出了:BERTScore,这是一种基于预训练的BERT上下文嵌入 (bert)的评估指标。 BERTScore将两个句子之间的相似度计算为它们的标记之间的余弦相似度的加权汇总。基于n-gram matching metric 的常见缺陷:semantically-correct phrases are penalized because they原创 2021-10-11 14:37:11 · 14713 阅读 · 4 评论