论文信息
题目:Progressive Semantic-Guided Vision Transformer for Zero-Shot Learning
用于零样本学习的渐进式语义引导视觉Transformer
作者:Shiming Chen, Wenjin Hou, Salman Khan, Fahad Shahbaz Khan
论文创新点
- 渐进式语义引导的视觉Transformer(ZSLViT):该论文提出了一种新的零样本学习框架,称为ZSLViT,旨在通过渐进式学习与语义相关的视觉特征,从而改进视觉-语义交互。
- 语义嵌入的token学习(SET):作者引入了语义嵌入的token学习(SET)机制,通过语义增强和语义引导的