AIGC
文章平均质量分 94
MaoziShan
这个作者很懒,什么都没留下…
展开
-
CVPR | Let‘s Think Outside the Box: Exploring Leap-of-Thought in LLM with Creative Humor Generation
大喜利”本来是指一系列日本传统戏剧游戏,随着时代的快速发展。现代的“大喜利”,目前一般是指一种叫Tonchi (頓智)的游戏,通常以游戏节目或智力问答节目的形式呈现,可以参考B站的日本著名节目IPPON大獎賽 (视频链接)。玩家被提供各种多模态内容,可以是简单的问题、随机图像等,然后提示玩家想出幽默的、有创意的反应,以达到令人惊讶的喜剧效果,如下图所示的例子。例子1) 在第一个“图文到文”的例子中,玩家要求阅读图像,和上面对应的文字,尝试想出一段文字填入对应的“问号?原创 2024-04-14 15:33:33 · 1125 阅读 · 0 评论 -
SUR-adapter: Enhancing Text-to-Image Pre-trained Diffusion Models with Large Language Models
一般来说,如果是人类使用stable diffusion这样的模型时,写出来的prompt是接近自然语言(simple prompt),而不是一些复杂的甚至是特定格式的“咒语”(complex prompt)。因此一种直觉的想法是:如何将大语言模型的语义能力迁移到预训练文本编码器如CLIP中,以减缓图文不匹配的问题?本文引入一个transformer结构的Adapter在特定隐含层中蒸馏大语言模型的语义特征,并将Adapter引导的大语言模型信息和原来文本编码器输出的语义特征做线性组合获得最终的语义特征。转载 2023-08-22 13:28:22 · 308 阅读 · 0 评论