5月9日|探究线性表示在大语言模型中的起源

4c3fee305a7b9042b626d20cbdb3aa92.png

报告主题:探究线性表示在大语言模型中的起源

报告日期:5月9日(周四)10:30-11:30

报告要点

538826ad06525f782cc76d95dd23b715.png

大语言模型的成功很大程度上归结于它能有效的把海量信息压缩在模型的向量空间中。这项工作研究了这个基础问题: 大语言模型是如何表示高级语义概念的. 以往的研究发现高级语义概念通常在大语言模型的表示空间中被“线性”编码。是什么原因导致了这一现象呢? 在这项工作中,我们研究了这种线性表示的起源。我们发现这和下一个标记预测的目标和梯度下降的隐含偏差(implict bias)有关. 我们同时也验证了我们的理论在LLaMA-2 语言模型上.

报告嘉宾

蒋贻博,论文一作,芝加哥大学计算机博士生, 导师为Victor Veitch教授. 他的研究领域包括特征学习, 因果推断, 可解释性. 硕士毕业于哥伦比亚大学,本科毕业于UIUC。

d81809a1b48872dcd126490ee8db30ec.png

扫码报名


424926035f68464df9ee0f2920d336a4.png


40fc41b0c1188eda3e2868194840ed39.png

d5c571d861050ec5c7084399a07aae29.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值