论文阅读——Flamingo

Flamingo: a Visual Language Model for Few-Shot Learning

模型建模了给定交织的图片或支=视频的条件下文本y的最大似然:

1 Visual processing and the Perceiver Resampler

Vision Encoder:from pixels to features。

预训练并且冻结的NFNet,在我们的数据集上使用文本图片对的对比损失训练,然后把提取的特征打成向量。

Perceiver Resampler:from varying-size large feature maps to few visual tokens。 

连接vision encoder 和 frozen language model。Vision Encoder得到的特征数量不一样,这部分处理成一样的。学习了预定义数量的潜在输入查询,这些查询被送到Transformer并交叉关注视觉特征。

2 Conditioning frozen language models on visual representations

在Perceiver Resampler产生的视觉表示的条件下,文本生成由Transformer解码器执行。

冻结LM blocks,在原始层之间插入gated cross-attention dense blocks。     

tanh-gating mechanism:新加层的输出在将其从残差连接添加到输入表示之前乘以tanh(𝛼)。

3 训练时的一些说明

1)Multi-visual input support: per-image/video attention masking

通过掩蔽全文到图像的交叉注意力矩阵,该矩阵限制了模型在每个文本标记处看到的视觉标记。在给定的文本标记下,模型关注交错序列中出现在其之前的图像的视觉标记,而不是所有先前的图像。尽管模型一次只直接关注单个图像,但对所有先前图像的依赖性仍通过LM中的自我关注保持。重要的是,这种单图像交叉注意力方案允许模型无缝地推广到任何数量的视觉输入,无论在训练期间使用多少。特别是,当在交错数据集上进行训练时,我们每个序列最多只使用5个图像,但我们的模型能够在评估过程中受益于多达32对(或“镜头”)图像/视频和相应文本的序列。

2)Training on a mixture of vision and language datasets

三类数据集训练

M3W: Interleaved image and text dataset

Pairs of image/video and text

3)Multi-objective training and optimisation strategy:

在给定视觉输入的情况下,我们通过最小化每个数据集预期的文本负对数可能性的加权和来训练我们的模型:

4 附录一些内容:

原文内容还有很多细节。

  • 7
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Android Studio Flamingo 是一个 Android 应用开发的集成开发环境(IDE),可以帮助开发者进行应用程序的编写、调试、测试和发布。以下是关于如何下载 Android Studio Flamingo 的指南: 1. 首先,打开您的互联网浏览器,并访问 Android Studio 的官方网站,网址为:https://developer.android.com/studio/flamingo/index.html。 2. 在主页中,您可以看到一个按钮,上面写着 "Download Android Studio"。点击该按钮。 3. 网页会自动识别您的操作系统(Windows、Mac 或 Linux),并为您提供相应的下载选项。请确保选择适合您操作系统的版本。 4. 点击下载按钮后,您将被引导到下载页面。此页面将向您展示有关下载进度以及相关的安装说明。请耐心等待,直到下载完成。 5. 下载完成后,双击下载文件以运行安装程序。根据屏幕上显示的指示,您需要选择安装目录、配置虚拟设备等。 6. 在安装过程中,您可能需要同意一些许可协议和条款。请仔细阅读并同意。 7. 安装完成后,您可以在开始菜单或应用程序文件夹中找到 Android Studio Flamingo 的图标。双击图标打开 IDE。 8. 第一次运行 Android Studio Flamingo,您可能需要下载一些额外组件或依赖项。请按照屏幕上显示的指示进行操作,并等待下载完成。 9. 完成上述步骤后,您现在已经成功地下载和安装了 Android Studio Flamingo。您可以立即开始使用它来开发您的 Android 应用程序了。 希望以上指南能帮助您顺利下载和使用 Android Studio Flamingo。祝您在 Android 应用开发的旅程中取得成功!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值