论文
文章平均质量分 93
深度学习论文内容分享
小夏refresh
深度学习炼丹师一枚
展开
-
DGMamba: Domain Generalization via Generalized State Space Model论文笔记
DGMamba论文笔记。基于Mamba在领域泛化上的应用原创 2024-07-02 16:13:32 · 738 阅读 · 0 评论 -
模型微调方法
LoRA假设微调期间的权重更新可以很好地近似于低秩矩阵。LoRA不会更新全权重矩阵W\mathbf{W}W, 而是将更新分解为两个较小的矩阵A\mathbf{A}A和B\mathbf{B}B具体的训练过程是: 将原来的矩阵参数固定,然后利用新的数据继续训练大模型,训练过程只更新A\mathbf{A}A和B\mathbf{B}B矩阵。在推理时,将原来的矩阵W\mathbf{W}W和(A×B)(\mathbf{A}\times\mathbf{B})(A×B)相加。权重分解低秩适用(DORA)将预训练的权重分原创 2024-06-30 15:27:53 · 506 阅读 · 0 评论 -
VMamba: Visual State Space Model论文笔记
VMamba论文阅读笔记,不包含实验部分原创 2024-06-26 16:19:23 · 1183 阅读 · 0 评论 -
Mamba: Linear-Time Sequence Modeling with Selective State Spaces论文笔记
Mamba论文阅读笔记,包含知识补充,但不包含实验及后面部分原创 2024-06-19 00:06:11 · 480 阅读 · 0 评论 -
Harnessing Vision Foundation Models for Domain Generalized Semantic Segmentation
Stronger, Fewer, & Superior: Harnessing Vision Foundation Models for Domain Generalized Semantic Segmentation论文笔记原创 2024-06-17 11:13:33 · 330 阅读 · 1 评论