论文详解KnowledGPT: Enhancing Large Language Models with Retrieval and Storage Access on Knowledge Bases

ws_nlp_

已于 2023-10-10 13:42:26 修改

阅读量478

点赞数 2

文章标签：语言模型人工智能自然语言处理

于 2023-10-10 11:50:50 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_33624866/article/details/133743827

版权

三个大步骤
1、生成搜索代码
2、搜索知识库，得到知识
3、知识+问题：回答

1-1、（利用提示）使用GPT-4生成python搜索代码，生成三个KB函数（感觉就是包含了实体抽取，关系抽取，代码生成等内容）
1-2、设计了三个KB函数流程：实体查询，实体+关系-实体查询，实体+实体=关系查询
实体+关系=实体查询包括：
1-2-1、实体链接
1-2-1-1、embedding模型，计算sim得到候选
1-2-1-2、实体查询，查询候选知识，截断
1-2-1-3、GPT-4选择链接实体
1-2-2、关系搜索
1-2-2-1、embedding模型，计算sim得到关系候选(利用A，B搜索A，B，C)
1-3、回答，使用了GPT-4进行回答

准备：知识图谱、描述知识库、embedding模型
使用：最多三个GPT-4问答
与我们最开始的区别：
我们embedding化，检索，直接回答
这个是优化了embedding的方法，将问题变为实体抽取，关系抽取，步骤生成，然后embedding不同部分，可能是多重embedding加上关系的实体链接后embedding，然后再检索，再回答。

embedding方法为text-embedding-ada-002模型。

总结:使用了一个模型、一个GPT的API和一个KG进行问答
评估：一共11条，GPT4效果优于ChatGPT，即GPT3.5没有生成检索代码的能力（较差），而其他开源模型如LLM更难，问答、代码生成、格式等生成都无法实现
为什么用多轮：效果更好，虽然效率极大下降
费用限制：较小数据集的实验

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。