终身模型编辑GRACE:从源头消除大模型“幻觉”,性价比吊打传统微调方法

现有的大模型主要依赖固定的参数和数据来存储知识,一旦训练完成,修改和更新特定知识的代价极大,常常因知识谬误导致模型输出不准确或引发“幻觉”现象。所以模型编辑格外重要。麻省理工提出了GRACE终身模型编辑方法,使用离散的键值适配器来对部署的模型进行持续的编辑和优化,以应对模型随时间老化的问题。

942a78f31213437ed804019909055635.png

为了让大家更好的掌握GRACE,研梦非凡于11月29日晚(周五),邀请了多模态专家王导师,为大家独家详解《免训练大模型编辑,从源头消除大模型“幻觉”》,从大模型现有问题到模型编辑的原因与优势,重点讲解GRACE的代码实现以及实验研究,并对未来研究方向进行详细分析,一文速通GRACE,为你的研究带来新的思路和突破!

👇🏻扫描二维码找助教0元预约直播课!

a89ede9b71bacd468aee2ada32a0836d.png
凡预约即可免费领取300篇前沿论文(模型编辑+大模型+多模态)

032f79f528436ef8ed20609cc803d358.png

46eda8dad71ffb6c45552bce0e4b790a.gif

直播课内容预览

NeurIPS MIT《Aging with GRACE: Lifelong Model Editing with Discrete Key-Value Adaptors》

一、研究背景

  1. 关注问题

  • 语言模型出现性能下降

  • 重新训练或微调成本高昂

  • 持续学习方法存在局限性

二、相关工作

EMNLP《Editing Large Language Models: Problems, Methods, and Opportunities》

  1. 为什么要模型编辑

  2. 模型编辑的目标

  3. 模型编辑

  • 可靠性

  • 泛化性

  • 局部性

  1. 方法分类

  • 保留模型参数

  • 修改模型参数

👇🏻扫描二维码找助教0元预约直播课!

9f390a46300289d56347352935957207.png
凡预约即可免费领取300篇前沿论文(模型编辑+大模型+多模态)

三、方法:GRACE

  1. GRACE 模型架构

  • 终身模型编辑

  1. 组件

  • Codebook(代码簿)

    • Keys(键)

    • Values(值)

    • Deferral radii(延迟半径)

  • Deferral Mechanism(延迟机制)

  1. 算法

  • 问题表述

  • 编辑过程

  • 反向传播

  • 推理

四、实验

  1. 训练与测试

  2. 数据集设置

  3. 实现细节

  4. 实验结果

五、代码实现

  1. 环境设置

  2. 数据准备

  3. GRACE模型实现

  4. 编辑器组件

  5. 实验配置

  6. 运行实验

  7. 结果分析

  8. 代码结构

六、未来研究方向

  1. 多跳编辑

  • 概念

  • 实验分析

  • 方法

  • 结论

👇🏻扫描二维码找助教0元预约直播课!

739e06e171bd0562176ea13665aa02e1.png
凡预约即可免费领取300篇前沿论文(模型编辑+大模型+多模态)

17acbae919598e0d8154a2e9c804f642.png

69182f5915dc7f7fe6fbb0835011ce65.gif

直播导师介绍

王导师

【学术背景】拥有丰富的深度学习研究、论文发表经验,多篇SCI论文、EI会议论文(一作)

【研究方向】大语言模型、视觉语言模型、多模态学习,以及自然语言处理、进化算法等

👇🏻扫描二维码找助教0元预约直播课!约导师meeting~

4a01445ea991ef0365bc20a470135b15.png
ps:研梦非凡开设的前沿论文系列直播,旨在帮助大家提升读论文技能,快速抓住重点,掌握有效方法,进而找到创新点,轻松产出科研论文成果。

研梦非凡科研论文指导

科研论文idea,并非拍脑门就能产生,需要经过一遍遍做实验、跑代码、改模型、思路修正。研梦非凡专业论文指导,和研梦导师一起找idea,共同解决科研问题。授之以渔——搭建论文写作框架,增删改查,针对性实验指导!哪里薄弱补哪里!

a13d95fedfd6e4aebd792f2e8dab94f2.jpegadfcd11886e858188540341422957eee.jpeg

<<< 左右滑动见更多 >>>

下面是我们整理的自动驾驶idea!

7dd06807129eb592879536aa33ddc5cc.png

可辅导的自动驾驶方向

9c9fb7d7dfe062a965210601af3d8ae3.jpeg893e70a44b8b2986590285564bcdc8f5.jpeg28bd641371c67ee9f1dd84b7a3a6cca4.jpeg

<<< 左右滑动见更多 >>>

扫码匹配合适方向的论文辅导adbed667c1f28ba837bda542f111c120.png

研梦非凡部分导师介绍

研梦非凡导师团队,来自海外QStop200、国内华五、C9、985高校的教授/博士导师/博士后,以及世界500强公司算法工程师、国内外知名人工智能实验室研究员等

这是一支实力强大的高学历导师团队,在计算机科学、机器学习、深度学习等领域,积累了丰富的科研经历,研究成果也发表在国际各大顶级会议和期刊上,在指导学员的过程中,全程秉持初心,坚持手把手个性化带教。包括但不限于以下导师~

cd5cf3779237f5fd5296541b76e614b7.jpeg40b3f44844242ae496aa970bbe4f83e4.jpeg4e2b456af2af1546c3875d73aac70561.jpeg2535a88c1bf9eed09113c666ac81ae44.jpeg2357a1333eeecac7e60f52ec8318e921.jpeg101558ee982b759afd2d5d4f56b09c96.jpeg19e3eb7fb39d11d48359fd3416bfe4cd.jpege8deca394934e2cf5f45bef11b63d25b.jpeg

<<< 左右滑动见更多 >>>

1406083371cfd24452b73a02ece8300c.png
扫码预约研梦非凡1v1导师meeting

如果你预算有限,1对1论文辅导压力太大那《6人尖端科研课题组》是最优选

全新6人尖端科研课题组论文辅导

8768e2ac3dbd4444048bec2dcf7bc1e3.jpeg7f4e4ca98b241aa994ce402af82f8506.jpeg

<<< 左右滑动见更多 >>>

扫码了解科研课题组论文辅导

bf381076a990cfcfe3f4a1c3228c4520.png

我们不是小作坊哦~我们背靠研途考研(就是张雪峰老师和徐涛老师在的那个研途考研),做教育十余年,重交付,重口碑,是我们一贯的公司理念!

84c4b7b2943684f6d242053d12e0b703.png
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值