Prompt—从CLIP到CoOp,Visual-Language Model新范式 - 知乎
最近在看多模态预训练模型时,看到很多关于文本-图像预训练模型中的一些概念,有提高prompt的,这里参考了一些博客和知乎大神分享的内容,总结一下,方便自己以后查阅,如有错误之处,欢迎指正!
文中涉及以下论文:
1.CLIP: Learning Transferable Visual Models From Natural Language
论文链接:https://arxiv.org/pdf/2103.00020.pdf
2. CoOp: Learning to Prompt for Vision-Language Models
论文链接:https://arxiv.org/pdf/2109.01134.pdf
3. Conditional Prompt Learning for Vision-Language Models
论文链接:https://arxiv.org/abs/2203.05557