chatgpt在复杂问题的回答表现

夏殇0808

已于 2023-06-06 16:21:30 修改

阅读量4.4k

点赞数 1

文章标签：人工智能 chatgpt

于 2023-05-26 18:44:18 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012328476/article/details/130887482

版权

2023年东南大学论文：Evaluation of ChatGPT as a Question Answering System for Answering Complex Questions

代码库已经无法访问了：https://github.com/tan92hl/Complex-Question-Answering- Evaluation-of-ChatGPT

1.简介

复杂问题的回答（KB-based CQA）是一种很有挑战性的KBQA任务，希望模型能具备compositional reasoning的学习能力，比如通过多步推理、进行集合操作或者其他复杂推理得到最终的答案。

如何去评判ChatGPT的回答表现呢？一方面，该文章采用的方法是，对测试问题进行打多个标签：答案类型（语法分析获得），推理操作，语种（数据集带了），这些标签每一个都可以助于分析ChatGPT的推理能力，标签间的组合也有助于发现潜在的问答场景和ChatGPT的表现情况。另一方面，沿用了checklist的测试方法对模型推理任务执行情况、推理过程可信服进行了测试。

KBQA数据集有很多，格式也不尽相同，这里选择的是基于SPARQL格式的数据集，并利用关键字来识别可能用于回答的推理操作。

结果简述：

单语问题的回答上，

最低0.47元/天解锁文章

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
chatgpt在复杂问题的回答表现

2023年东南大学的论文，主要介绍了LLM在复杂问题回答上的表现，主要是8个KBQA数据库。该文章将复杂问题进行了分类，并定义了多种标签来区分模型给出的多种理由。并利用CHAECKLIST对模型进行多项能力评估。
复制链接

扫一扫

夏殇0808 CSDN认证博客专家 CSDN认证企业博客

码龄11年

158: 原创

24万+: 周排名

126万+: 总排名

33万+: 访问

: 等级

4225: 积分

73: 粉丝

109: 获赞

39: 评论

389: 收藏

私信

关注

热门文章

分类专栏

笔记 9篇
NLG 35篇
联邦学习 1篇
pytorch 1篇
增强学习 6篇
工具类
tornado 1篇
学习笔记 121篇
python练习 6篇
machine learning 8篇
书摘 4篇
cpp 13篇
spark 6篇
git 3篇
SQL 9篇
installation questions 1篇
Linux 10篇
leetcode 3篇
algorithm 9篇
unsolved 1篇

最新评论

源码阅读-CVAE模型
dream collector.: 请不要抄苏剑林的文章
源码阅读-CVAE模型
Zoe_807: 大佬，源码可以发我一份嘛？
chatgpt在复杂问题的回答表现
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/615562980。
chatgpt在复杂问题的回答表现
CSDN-Ada助手: 一定要坚持创作更多高质量博客哦, 小小红包, 以资鼓励, 更多创作活动请看: 职场解惑讨论会: https://activity.csdn.net/creatActivity?id=10427?utm_source=csdn_ai_ada_redpacket Microsoft Edge功能测评！: https://activity.csdn.net/creatActivity?id=10403?utm_source=csdn_ai_ada_redpacket 程序员有哪些绝对不能踩的坑？: https://activity.csdn.net/creatActivity?id=10433?utm_source=csdn_ai_ada_redpacket 全部创作活动: https://mp.csdn.net/mp_blog/manage/creative?utm_source=csdn_ai_ada_redpacket
论文阅读-Fantastically Ordered Prompts and Where to Find Them: Overcoming Few-Shot Prompt Order Sensitiv
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。