自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

qq_43404360的博客

翻译 Bootstrapping Vision-Language Learning with Decoupled Language Pre-training

本文提出了一个新颖的方法，旨在优化大语言模型（LLM）在资源密集型视觉-语言预训练中的应用。当前的范式是使用视觉特征作为提示词引导语言模型，集中于找到于文本最相关的视觉特征。所提方法方法不同在关注语言部分，特别是与视觉特征对齐的最优提示词。所提方法引入了 Prompt-Transformer (P-Former)，用于预测理想的提示词，它基于语言数据进行训练，不再需要大量图-文数据的成对训练。该策略巧妙地将端到端地视觉-语言训练过程分为一个额外的、独立的阶段。

2024-09-04 17:36:19 275

翻译【论文阅读】SwAV: Unsupervised Learning of Visual Features by Contrasting Cluster Assignments

SwAV论文阅读，仅涉及方法部分，如不完整，随时补充

2024-09-02 12:08:59 362 1

原创【论文解读】谐波网络（Harmonic Network)

【论文理解】谐波网络（Harmonic Network）

2023-10-24 22:47:07 1044

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

博客等级

码龄7年

1
原创

21
点赞

7
收藏

7
粉丝

关注

私信

热门文章

分类专栏

多模态模型预训练 1篇
对比学习相关论文 1篇

最新评论

【论文阅读】SwAV: Unsupervised Learning of Visual Features by Contrasting Cluster Assignments
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

提示

确定要删除当前文章？

取消删除