自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 ViT-Adapter:Vision Transformer Adapter for Dense Predictions

作者将原使用特定的模型进行预训练并微调的训练方式,更改为了用ViT进行预训练,在微调阶段加入了Adapter,其中ViT-Adapter相当于先使用FPN学习多尺度的先验信息,并加入了Injector和Extractor,用来给ViT主干传递空间先验特征和从ViT中得到新的先验特征,最终该模型在语义分割方向取得了不错的效果。

2022-11-09 17:11:36 932 1

原创 DenseCLIP:Language-Guided Dense Prediction with Context-Aware Prompting

DenseCLIP将CLIP模型应用到了密集预测任务中,将原来的只使用image encoder进行预训练并在下游任务中微调,修改成了使用image encoder和text encoder进行预训练(CLIP),并在微调时,将text encoder的权重固定,只训练image encoder和image decoder中的权重。DenseCLIP成功的将文本信息运用到了图像的密集预测任务中。

2022-11-08 19:16:48 1365

原创 CoOp: Learning to Prompt for Vision-Language Models

CoOp将人工设置的Prompt,变为一个learnable prompt,并在CLIP上取得了很不错的效果。

2022-11-05 10:15:54 2259 1

原创 CLIP:Learning Transferable Visual Models From Natural Language Supervision

CLIP打破了原有的CV领域模型的设计思路,其一次训练得到的参数可应用到所有的分类任务当中,其使用了文本和图片的对应关系,在30多个数据集上效果相当于CNN网络中的Resnet50,并且迁移性强,鲁棒性好。

2022-11-04 18:43:21 729

原创 ViT:An Image is Worth 16x16 Words:Transformers for Image Recognition at Scale

ViT:An Image is Worth 16x16 Words:Transformers for Image Recognition at Scale

2022-11-03 21:44:56 635

原创 Transformer:Attention Is All You Need

Transformer的结构模型以及其具体细节。

2022-11-03 17:12:07 147

原创 DP(动态规划)学习笔记

DP(动态规划)学习笔记背包问题① 01背包 每件物品最多使用一次② 完全背包 每件物品有无限个③ 多重背包 每种物品最多有si个 (存在朴素版和优化版)④ 分组背包 没组最多只能选 1 个DP优化:对dp方程进行等价变形DP最重要的就是公式推导(对于当前状态的计算)要满足两个条件:①不重 ②不漏1.01背包问题题目链接:https://www.acwing.com/problem/content/2/最简单的01背包dp[i][j]=max(dp[i−1][j],dp[i−1][

2020-11-06 21:00:02 115

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除