#今日论文推荐# 教大模型自己跳过“无用”层，推理速度×3性能不变，谷歌MIT这个新方法火了

最新推荐文章于 2024-07-23 22:48:04 发布

wwwsxn

最新推荐文章于 2024-07-23 22:48:04 发布

阅读量118

点赞数

分类专栏：深度学习文章标签：深度学习计算机视觉人工智能

原文链接：https://www.aminer.cn/research_report/62ddfb537cb68b460ff3606d

版权

深度学习专栏收录该内容

716 篇文章 30 订阅

订阅专栏

#今日论文推荐# 教大模型自己跳过“无用”层，推理速度×3性能不变，谷歌MIT这个新方法火了

大语言模型用着爽，但推理速度实在太慢了？
而且，增加模型体积，推理效果也并不一定就比之前更好。
为了解决这一问题，谷歌MIT的研究人员提出了一个新框架CALM，让它自己来决定计算量。
如果CALM意识到某些层“可有可无”，那么它在计算时就会跳过这些层。
论文被po到网上后，立刻火了一波.

有网友表示，我们就是需要这样更智能和自适应的模型，显然CALM的解码器已经做到了.

直接用中间层输出结果
CALM全称Confident Adaptive Language Modeling，即置信自适应大语言模型。
这一模型基于Transformer架构，为了加速它的计算，研究人员提出了一个名叫“提前退出”（early exiting）的方法，让模型根据不同的输入，动态决定要用多少层网络来计算。
也就是说，在计算的过程中，模型不需要经过每一层计算再输出结果，而是能直接用中间层的特征输出token，从而降低模型计算量。

论文题目：Confident Adaptive Language Modeling
详细解读：https://www.aminer.cn/research_report/62ddfb537cb68b460ff3606dhttps://www.aminer.cn/research_report/62ddfb537cb68b460ff3606d
AMiner链接：https://www.aminer.cn/?f=cs

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
#今日论文推荐# 教大模型自己跳过“无用”层，推理速度×3性能不变，谷歌MIT这个新方法火了

归纳翻译QA三大任务都能hold住。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。