- 博客(20)
- 收藏
- 关注
原创 读论文笔记-LLaVA:Visual Instruction Tuning
研究机构:Microsoft Research发表于2023的NeurIPS。
2025-04-30 22:36:15
1016
1
原创 读论文笔记-CoOp:对CLIP的handcrafted改进
现有基于prompt engineering的多模态模型在设计合适的prompt时有很大困难,从而设计了一种更简单的方法来制作prompt。
2025-04-30 20:59:37
1331
1
原创 读论文笔记-Controllable Forgetting Mechanism for Few-Shot Class-Incremental Learning
论文阅读
2025-03-21 10:35:03
822
1
原创 读论文笔记-BRAVE:Broadening the visual encoding of vision-language models
BRAVE论文阅读
2025-03-19 12:12:49
742
1
原创 Win11下安装CUDA+Miniconda3+Pytorch虚拟环境
我在后面下载Pytorch的时候发现指令里面也有下载cudatoolkit(只是部分版本的指令有),但其实也可以先下载Cudnn。一般来说,笔记本电脑的控制面板旁有NVIDIA的绿标则代表电脑支持CUDA。选择对应cuda toolkit版本的cudnn,下载对应系统的压缩包。
2024-10-24 10:33:34
1304
原创 代码复现-Transformer Model Architecture
本文所呈现代码,仅为复现模型各部分代码,不用于训练。如果需要进行训练的完整代码,请见代码块中的注释部分。
2024-08-30 16:32:32
199
原创 Context-Transformer:Tackling Objection Confusion for Few-Shot Detection论文汇报
本文是我上一篇解读的CVPR2024论文的基础。
2024-07-17 14:31:26
811
原创 Few-Shot Object Detection with Sparse Context Transformers-CVPR论文汇报
迁移学习就是在源域(source domain)上训练好一个检测模型后,送到目标域(target domain)上微调。
2024-07-12 10:03:21
992
少样本目标检测改进后AP50变低
2024-09-18
TA创建的收藏夹 TA关注的收藏夹
TA关注的人