问答系统评估标准

773 篇文章 40 订阅 ¥99.90 ¥299.90
637 篇文章 4 订阅 ¥199.90 ¥299.90

目录

问答系统评估标准

忠实度

答案相关性:计算生成问题和原始问题之间的余弦相似度

上下文召回率

答案准确性


问答系统评估标准

  1. 忠实度

    • 定义:衡量问答系统生成的答案是否忠实于给定的输入(如问题本身、相关的文档或知识源)。它关注的是答案是否基于正确的信息源,没有引入无关或错误的内容
    • 评估方法:人工检查答案中的信息是否都能在输入的知识源中找到依据。例如,如果问题是 “《红楼梦》中贾宝玉的性格特点是什么”,答案中提到的 “叛逆、多情” 等特点应该是在《红楼梦》文本中有体现的,而不是凭空捏造的。可以通过计算忠实信息占整个答案信息的比例来量化,比如答案中有 80% 的内容能在知识源中找到依据,忠实度可以记为 0.8。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ZhangJiQun&MXP

等到80岁回首依旧年轻

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值