[Arxiv 2024] EAGLE-2: Faster Inference of Language Models with Dynamic Draft Trees

Introduction

  • 作者提出 Context-Aware Dynamic Draft Tree,对 EAGLE 中固定的 draft tree 做出了改进,通过动态扩展 draft tree 有效节省 draft model 的推理时间,还能通过 token re-rank 给 LLM 提供更少更高质量的 draft tokens,从而在保证接收率的前提下降低 LLM 的验证时间,相比 EAGLE 有了明显的加速
    在这里插入图片描述在这里插入图片描述

Method

  • Expansion Phase. 在扩展 draft tree 时,只选择最深层上累积接收概率最高的 top- k k k tokens 进行扩展,从而降低 draft model 的推理开销,其中累积接收概率为根节点到当前节点的接收概率之积,接收概率可以用 token 置信度近似 V i = ∏ t j ∈ Path ( root , t i ) p j ≈ ∏ t j ∈ Path ( root , t i ) c j V_i=\prod_{t_j\in\text{Path}(\text{root},t_i)}p_j\approx\prod_{t_j\in\text{Path}(\text{root},t_i)}c_j Vi=tjPath(root,ti)pjtjPath(root,ti)cj (作者发现 draft model is well-calibrated);例如下图中,只选择 current layer (orange blocks) 进行扩展
    在这里插入图片描述
  • Reranking Phase. draft tree 扩展完成后,作者从 token tree 中选出累积接收概率的 top- m m m tokens 交给 LLM 验证,如果两个 token 累计接收概率相同,则优先选择位于更浅层的 token;这样选出的 top- m m m tokens 仍然可以形成一棵树,可以用 tree attention 进行验证
    在这里插入图片描述

Experiments

  • Effectiveness.
    在这里插入图片描述在这里插入图片描述
  • Ablation Study. 这里的 w/o value 指扩展 draft tree 时不使用累积接收概率而是直接使用单个 token 的 confidence
    在这里插入图片描述

References

  • 17
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
simclr-in-tensorflow-2是一个在TensorFlow 2中实现SimCLR(https://arxiv.org/abs/2002.05709)算法的项目。SimCLR是一种自监督学习方法,用于无标签图像数据的表示学习。 实现SimCLR在TensorFlow 2中的方法如下: 首先,我们导入必要的库和模块。其中包括TensorFlow 2、TensorFlow Datasets(用于加载图像数据集)和其他辅助函数。 然后,我们定义一个数据预处理函数,用于对图像数据进行预处理。这包括图像的随机裁剪、随机水平翻转、归一化和调整大小等操作。 接下来,我们构建模型。SimCLR模型由一个特征提取器和一个投影头组成。特征提取器通常是一个预训练的卷积神经网络,如ResNet。投影头是一个全连接层,将特征映射到一个较低维度的向量空间。 然后,我们定义损失函数。SimCLR使用对比损失函数,它衡量正样本对和负样本对之间的相似性。在训练过程中,我们从数据集中选择两个样本,将它们通过特征提取器和投影头得到两个特征向量。然后,我们计算这两个向量之间的相似性,并用一个交叉熵损失函数最小化它。 在训练过程中,我们使用随机梯度下降(SGD)或Adam优化器进行参数优化。我们还定义了一些训练的超参数,如学习率、批量大小和训练迭代次数。 最后,我们对模型进行训练。我们从数据集中加载图像数据,并将其送入模型进行前向计算和反向传播。在训练过程中,我们监视损失函数的变化,并在训练结束后评估模型的性能。 通过以上步骤,我们就可以在TensorFlow 2中实现SimCLR算法。这个实现能够利用无标签的图像数据进行自监督学习,从而得到有用的图像表示。这些表示可以用于各种计算机视觉任务,如图像分类、物体检测和图像生成等。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值