- 博客(7)
- 收藏
- 关注
原创 ViT-Adapter:Vision Transformer Adapter for Dense Predictions
作者将原使用特定的模型进行预训练并微调的训练方式,更改为了用ViT进行预训练,在微调阶段加入了Adapter,其中ViT-Adapter相当于先使用FPN学习多尺度的先验信息,并加入了Injector和Extractor,用来给ViT主干传递空间先验特征和从ViT中得到新的先验特征,最终该模型在语义分割方向取得了不错的效果。
2022-11-09 17:11:36 932 1
原创 DenseCLIP:Language-Guided Dense Prediction with Context-Aware Prompting
DenseCLIP将CLIP模型应用到了密集预测任务中,将原来的只使用image encoder进行预训练并在下游任务中微调,修改成了使用image encoder和text encoder进行预训练(CLIP),并在微调时,将text encoder的权重固定,只训练image encoder和image decoder中的权重。DenseCLIP成功的将文本信息运用到了图像的密集预测任务中。
2022-11-08 19:16:48 1365
原创 CoOp: Learning to Prompt for Vision-Language Models
CoOp将人工设置的Prompt,变为一个learnable prompt,并在CLIP上取得了很不错的效果。
2022-11-05 10:15:54 2259 1
原创 CLIP:Learning Transferable Visual Models From Natural Language Supervision
CLIP打破了原有的CV领域模型的设计思路,其一次训练得到的参数可应用到所有的分类任务当中,其使用了文本和图片的对应关系,在30多个数据集上效果相当于CNN网络中的Resnet50,并且迁移性强,鲁棒性好。
2022-11-04 18:43:21 729
原创 ViT:An Image is Worth 16x16 Words:Transformers for Image Recognition at Scale
ViT:An Image is Worth 16x16 Words:Transformers for Image Recognition at Scale
2022-11-03 21:44:56 635
原创 DP(动态规划)学习笔记
DP(动态规划)学习笔记背包问题① 01背包 每件物品最多使用一次② 完全背包 每件物品有无限个③ 多重背包 每种物品最多有si个 (存在朴素版和优化版)④ 分组背包 没组最多只能选 1 个DP优化:对dp方程进行等价变形DP最重要的就是公式推导(对于当前状态的计算)要满足两个条件:①不重 ②不漏1.01背包问题题目链接:https://www.acwing.com/problem/content/2/最简单的01背包dp[i][j]=max(dp[i−1][j],dp[i−1][
2020-11-06 21:00:02 115
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人