大家好,这里是好评笔记,公主 号:Goodnote,专栏文章私信限时Free。本笔记的任务是解读多模态论文/面试过程中可能会用到的知识点,内容通俗易懂,入门、实习和校招轻松搞定。
公主号合集地址
点击进入免费
地址:多模态论文笔记合集
笔记介绍
本笔记的任务是解读当下前沿的热门多模态论文,多模态是AIGC时代链接不同模态之间的桥梁,为 AIGC 的进一步发展筑牢根基。本笔记力求以通俗易懂的语言,将复杂的论文知识点化繁为简。包括但不限于计算机视觉领域结合Transformer的ViT和ViLT,Transformer和Diffusion结合的生成式模型架构 DiT 和 U - ViT,图像和文本的联合训练CLIP、BLIP和BLIP2,离散空间的表征学习VQ - VAE、VQ - VAE - 2和dVAE(DALL·E的核心部件),知名多模态模型LLaVA,图像生成文本模型Coca和CogVLM系列。
其他
本笔记还在持续更新,欢迎各位关注公主号多模态论文笔记合集
合集目录
本系列其他相关笔记参考如下: