- 博客(12)
- 收藏
- 关注
原创 【VLM】AltCLIP: Altering the Language Encoder in CLIP for Extended Language Capabilities
改变CLIP中的语言编码器以扩展语言能力
2024-08-30 14:43:26
959
原创 【VLM】SigLIp: Sigmoid Loss for Language Image Pre-Training
SigLip的论文理解+复现心得
2024-07-29 15:15:33
5903
1
原创 【AIGC】基于文生图的人脸ID定制化方法
主要介绍**IP-Adapter(FaceID), InstantID, PuLID**三篇paper
2024-07-26 15:30:21
756
1
原创 MOAT:Alternating Mobile Convolution and Attention brings strong Vision Models
MOAT,CNN+VIT的异构模块
2023-10-13 15:35:03
162
原创 KD++:Improving Knowledge Distillation via Regularizing Feature Norm and Direction
对齐特征的norm与direction,提高蒸馏精度
2023-09-16 22:03:17
1527
2
原创 TinyViT: Fast Pretraining Distillation for Small Vision Transformers
预训练蒸馏+设计多尺度Block,提高小模型精度
2023-09-15 17:23:46
858
7
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人