论文详解KnowledGPT: Enhancing Large Language Models with Retrieval and Storage Access on Knowledge Bases

三个大步骤
1、生成搜索代码
2、搜索知识库,得到知识
3、知识+问题:回答

1-1、(利用提示)使用GPT-4生成python搜索代码,生成三个KB函数(感觉就是包含了实体抽取,关系抽取,代码生成等内容)
1-2、设计了三个KB函数流程:实体查询,实体+关系-实体查询,实体+实体=关系查询
实体+关系=实体查询包括:
1-2-1、实体链接
1-2-1-1、embedding模型,计算sim得到候选
1-2-1-2、实体查询,查询候选知识,截断
1-2-1-3、GPT-4选择链接实体
1-2-2、关系搜索
1-2-2-1、embedding模型,计算sim得到关系候选(利用A,B搜索A,B,C)
1-3、回答,使用了GPT-4进行回答

准备:知识图谱、描述知识库、embedding模型
使用:最多三个GPT-4问答
与我们最开始的区别:
我们embedding化,检索,直接回答
这个是优化了embedding的方法,将问题变为实体抽取,关系抽取,步骤生成,然后embedding不同部分,可能是多重embedding加上关系的实体链接后embedding,然后再检索,再回答。

embedding方法为text-embedding-ada-002模型。

总结:使用了一个模型、一个GPT的API和一个KG进行问答
评估:一共11条,GPT4效果优于ChatGPT,即GPT3.5没有生成检索代码的能力(较差),而其他开源模型如LLM更难,问答、代码生成、格式等生成都无法实现
为什么用多轮:效果更好,虽然效率极大下降
费用限制:较小数据集的实验

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值