中科院杨万里:大语言模型编辑中的崩溃相关系列研究分享

d36ac7db387f7ba301728fe84efc6463.png

主题

大语言模型编辑中的崩溃研究

时间

2024.11.17 10:30-11:30 周日

入群

欢迎加入NICE每周分享交流群,在群内与分享嘉宾和观众进行深入交流讨论,并且可第一时间收到后续NICE分享报告的通知。加群通过小助手认证,群内无广告。

2ac62b61eaae728be17cf49461e410cd.png

扫码加小助手微信进NICE每周报告分享交流群,备注“【昵称-单位-研究方向-NICE入群】 ”

内容

4ee88458786bc0428533c7e4e977c74d.png

8bc953230751c87c5d71626cb56cc151.png

论文1:The Butterfly Effect of Model Editing: Few Edits Can Trigger Large Language Models Collapse
链接:https://aclanthology.org/2024.findings-acl.322.pdf

论文2:The Fall of ROME: Understanding the Collapse of LLMs in Model Editing
链接:https://aclanthology.org/2024.findings-emnlp.236.pdf

代码:https://github.com/WLYangICT/Collapse-in-Model-Editing
项目主页:https://yangwl.site/collapse-in-model-editing

引言

模型编辑(Model Editing)技术在修正大语言模型的知识中展现出极大的潜力。然而,现有工作却忽视了它对语言模型固有能力的影响。我们深入研究了这一问题,并产出了两篇论文。第一篇论文揭示了少量编辑即可能导致语言模型崩溃的现象,并提出采用困惑度(Perplexity)作为诊断工具。该工作已被ACL2024 Findings收录。第二篇论文探讨了由最先进的编辑方法ROME触发的语言模型崩溃的根本原因,并提出了一个简单有效的解决方案。该工作已被EMNLP2024 Findings收录。

分享内容大纲

- 少量编辑即可导致大语言模型崩溃

  • 模型编辑副作用初探

  • 困惑度作为代理指标

  • 单次编辑导致模型崩溃

  • 连续编辑导致模型崩溃

  • HardEdit,更具挑战的编辑数据集

- 编辑导致模型崩溃的原因探索

  • ROME简介

  • ROME导致模型崩溃原因分析

  • C-ROME,简单有效地避免模型崩溃

a9b7e58fd24255ca66eed0ec55d9480e.png

杨万里,本科毕业于南开大学,现为中国科学院计算技术研究所一年级博士生,由刘欣然教授和孙飞副研究员共同指导。研究兴趣包括:自然语言处理,知识编辑,可信AI等。在ACL和EMNLP上发表论文3篇,其中2篇作为第一作者发表。个人主页:https://yangwl.site/


最近的EMNLP2024分享会录播

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值