chatgpt如何接入本地知识库?我们来看看EMNLP 2022 INFO是如何融入本地知识的

一、概述


title:You Truly Understand What I Need : Intellectual and Friendly Dialogue Agents grounding Knowledge and Persona
论文地址:You Truly Understand What I Need : Intellectual and Friendly Dialog Agents grounding Persona and Knowledge - ACL Anthology
代码地址:GitHub - dlawjddn803/INFO: Code for the paper "You Truly Understand What I Need : Intellectual and Friendly Dialogue Agents grounding Knowledge and Persona" which is accepted to EMNLP 2022 (Findings)
1.1 Motivation
1以前的研究将知识或个人资料混合融入预先训练的语言模型。其同时考虑知识和人物角色的能力仍然是有限的,导致生成结果出现幻觉,并且使用人物角色的方法也很被动。
1.2 Methods
1提出一种有效的agent,同时基于外部知识和persona。
2选择合适的知识和persona生成回答,利用poly-encoder的方法来实现候选打分。
3实施了人物角色级别指标,以考虑微妙的人物角色基础的多种人物角色选择。
4利用检索的方式来增强query,其包含知识-角色的增强信息,使其生成的回复少幻觉,多参与性。
5总结:1. 先计算persona和knowledge的分数 2. 选择合适的persona+knowledge 3. 结合2+query,检索相近的paragraphs 4. 生成更具信息量,更多参与度的responses。
1.3 Conclusion
1提出了INFO (Intellectual and Friendly dialOg agents),在persona-knowledge chat数据集自动评估metrics上取得sota。
2人工评估也显示其少幻觉,多参与性。
3相对于之前的检索器件retrievers,证明了我们retrievers的有效性,也比较了multiple candidate scoring的方法。
1.4 limitation
1缺乏真实的知识和persona候选,导致在现实环境不可用。
2评估幻觉的cases数量还比较少。
3需要高的GPU计算资源( since it marginalizes loss at the token level )
 

三、详细内容


3.1 整体架构图
主旨思想:利用对话历史信息,挖掘出最相近的背景信息,然后利用该信息检索出更多额外知识,进而提高生成结果的质量。
U:人类和机器的历史对话数据。
cand:每个候选,感觉是knowledge的候选 or persona的候选,目的是排序后选择分数最高的。
KPEQ(knowledge persona enhanced query):增强后的query
Retriever(Non parameters):非参数的,相当于是检索出相关文档,辅助额外的知识来提升回复效果。


3.2 语义检索效果比较:相对于bi-encoder双塔和cross-encoder,poly这种交互模式效果最好


3.3 实验结果
Generation:生成效果评估
Grounding:persona和knowledge分类预测的精度(挑选分数最高的persona和knowledge的精度吗?)
RAG:token级别生成效果好,sequence级别分类效果好


3.4 人工评估:效果碾压其他的


3.5 实验设置

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
emnlp2022是自然语言处理领域的一次重要会议,其官网是指为了宣传、组织和指导本次会议而建立的专门网站。emnlp2022官网旨在向全球的学术界和工业界展示本次会议的议程、主题、地点、时间等重要信息。通过官网,参会者可以获取到会议日程安排、主题演讲人信息以及各个会场的具体位置等相关资讯,以便做好参会准备。 emnlp2022官网的内容一般会包括以下几个方面:首先是会议的基本信息,包括会议名称、介绍、时间和地点等,使参会者能够了解会议的背景和基本情况。其次是会议议程,包括会议安排、主题演讲、分论坛等具体活动的时间和地点,以及各个活动的详细日程安排。此外,官网还会提供相关的注册、投稿、参会费用等信息,以便参会者进行报名和缴费。 emnlp2022官网还可以提供与会议内容相关的资源和工具,如论文集、演讲稿、演示视频等,方便参会者和其他学者深入了解会议的研究成果和进展。官网还可能设置在线论坛或社交媒体链接,使参会者和学术界同行之间能够进行交流和互动,增进合作与沟通。 总之,emnlp2022官网是该次会议的重要宣传平台,通过官网参会者可以获取到会议的重要信息、日程安排以及相关资源,为参会者提供便利,使会议更加规范、有序地进行,并促进学术界之间的交流与合作。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值