Dolly_DL-CSDN博客

原创【VLM】AltCLIP: Altering the Language Encoder in CLIP for Extended Language Capabilities

改变CLIP中的语言编码器以扩展语言能力

2024-08-30 14:43:26 959

原创【VLM】LongClip: Unlocking the Long-Text Capability of CLIP

LongClip

2024-08-20 15:21:31 567

原创知识蒸馏基本知识点

知识蒸馏基本知识点

2024-08-11 16:39:21 239

原创【VLM】SigLIp: Sigmoid Loss for Language Image Pre-Training

SigLip的论文理解+复现心得

2024-07-29 15:15:33 5903 1

原创【AIGC】基于文生图的人脸ID定制化方法

主要介绍**IP-Adapter(FaceID), InstantID, PuLID**三篇paper

2024-07-26 15:30:21 756 1

原创 CNet_img2img/reference-only的部分代码

CNet_img2img/reference-only的部分代码

2024-02-01 14:03:57 340

原创【浅读insightface-swapper】

浅读face-swapper

2024-01-30 20:32:32 910 1

原创 MOAT:Alternating Mobile Convolution and Attention brings strong Vision Models

MOAT,CNN+VIT的异构模块

2023-10-13 15:35:03 162

原创对DeiT中dist_token的理解

dist_token在pretrain与finetune时如何使用

2023-09-28 19:21:45 201

原创关于DWConv+Identity重参数化的理解

Identity如何等效为卷积

2023-09-21 22:33:38 321

原创 KD++：Improving Knowledge Distillation via Regularizing Feature Norm and Direction

对齐特征的norm与direction，提高蒸馏精度

2023-09-16 22:03:17 1527 2

原创 TinyViT: Fast Pretraining Distillation for Small Vision Transformers

预训练蒸馏+设计多尺度Block，提高小模型精度

2023-09-15 17:23:46 858 7

qq_37706246的博客