发布 BLEURT,用于评估自然语言生成模型

Google Research的工程师和研究员推出了BLEURT,一种新的自动化指标,用于更准确地评估自然语言生成系统的质量,其表现接近人工评估。BLEURT基于BERT的预训练和微调,能捕捉语义相似性,解决了现有自动化指标如BLEU侧重表面相似性的局限。研究表明,BLEURT在机器翻译和数据到文本的任务中与人工评分的相关性最高。
摘要由CSDN通过智能技术生成

文 / 软件工程师 Thibault Sellam 和研究员 Ankur P. Parikh

Google Research

近几年来,关于自然语言生成 (Natural Language Generation, NLG) 的研究取得了巨大进展。NLG 模型采用日益成熟的方法,以更高的准确率完成翻译文本文章总结进行对话以及图片注释等任务。目前,评估这些 NLG 系统的方法有两种:人工评估和自动化指标评估。人工评估会进行大规模的质量调查,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值