joseanne_josie-CSDN博客

原创读论文笔记-LLaVA：Visual Instruction Tuning

研究机构：Microsoft Research发表于2023的NeurIPS。

2025-04-30 22:36:15 1213 1

原创读论文笔记-CoOp：对CLIP的handcrafted改进

现有基于prompt engineering的多模态模型在设计合适的prompt时有很大困难，从而设计了一种更简单的方法来制作prompt。

2025-04-30 20:59:37 1465 1

原创读论文笔记-ALIGN：利用有噪声数据集扩大视觉和视觉-语言表示

ALIGN

2025-04-01 14:25:01 738 1

原创读论文笔记-Flamingo：少样本视觉语言模型

Flamingo

2025-03-28 21:55:07 1493 1

原创读论文笔记-CLIP-Adapter：用Adapter fine-tuning替代prompt-tuning

CLIP-Adapter

2025-03-25 16:12:39 1091 1

原创读论文笔记-BLIP-2

BLIP2

2025-03-22 15:56:30 1233 1

原创读论文笔记-Controllable Forgetting Mechanism for Few-Shot Class-Incremental Learning

论文阅读

2025-03-21 10:35:03 960 1

原创读论文笔记-BRAVE：Broadening the visual encoding of vision-language models

BRAVE论文阅读

2025-03-19 12:12:49 915 1

原创读论文笔记-MobileViT(2021)：轻量级的注意力机制

MoblieViT

2025-03-16 22:46:18 721 1

原创读论文笔记-Swin Transformer：引入多尺度

Swin Transformer笔记

2025-03-15 11:52:17 810 1

原创读论文笔记-Vision Transformer：做图像分类的Transformer

vision transformer笔记

2025-03-14 15:02:36 787 1

原创 Win11下安装CUDA+Miniconda3+Pytorch虚拟环境

我在后面下载Pytorch的时候发现指令里面也有下载cudatoolkit（只是部分版本的指令有），但其实也可以先下载Cudnn。一般来说，笔记本电脑的控制面板旁有NVIDIA的绿标则代表电脑支持CUDA。选择对应cuda toolkit版本的cudnn，下载对应系统的压缩包。

2024-10-24 10:33:34 1626

原创代码复现-Transformer Model Architecture

本文所呈现代码，仅为复现模型各部分代码，不用于训练。如果需要进行训练的完整代码，请见代码块中的注释部分。

2024-08-30 16:32:32 270

原创读论文笔记-BERT论文笔记（手写版）

手写笔记

2024-08-19 21:19:05 200 1

原创读论文笔记-Attention is all you need(Transformer)论文阅读（手写笔记）

论文笔记

2024-08-09 16:06:48 179 1

原创 Context-Transformer:Tackling Objection Confusion for Few-Shot Detection论文汇报

本文是我上一篇解读的CVPR2024论文的基础。

2024-07-17 14:31:26 841

原创 Few-Shot Object Detection with Sparse Context Transformers-CVPR论文汇报

迁移学习就是在源域（source domain）上训练好一个检测模型后，送到目标域（target domain）上微调。

2024-07-12 10:03:21 1109

原创读论文笔记-MambaOut学习笔记（手写版）

参考博客-极市平台

2024-05-27 21:46:05 292

原创代码复现-Vgg（李沐深度学习-Pytorch）

复现Vgg代码

2024-04-17 22:02:14 433

原创 WSL+Ubuntu+Miniconda+Pytorch

Ubuntu+WSL+Miniconda+Pytorch搭建

2024-03-25 22:42:54 1764 1

qq_73697176的博客