【深度学习】IP-Adapter-FaceID,IP-Adapter: Text Compatible Image Prompt Adapter for Text-to-Image Diffusion

论文: https://arxiv.org/abs/2308.06721

项目:https://huggingface.co/h94/IP-Adapter-FaceID

IP-Adapter: Text Compatible Image Prompt Adapter for Text-to-Image Diffusion Models

摘要

近年来,大型文本到图像扩散模型的强大能力在创造高保真图像方面取得了令人印象深刻的成果。然而,仅使用文本提示来生成所需图像是非常棘手的,因为这通常涉及复杂的提示工程。文本提示的一个替代方案是图像提示,正如俗话所说:“一幅图胜过千言万语”。尽管现有的直接从预训练模型进行微调的方法有效,但它们需要大量的计算资源,并且与其他基础模型、文本提示和结构控制不兼容。在本文中,我们提出了IP-Adapter,这是一种有效且轻量级的适配器,用于实现预训练文本到图像扩散模型的图像提示能力。我们IP-Adapter的关键设计是解耦的交叉注意力机制,它将文本特征和图像特征的交叉注意力层分离。尽管我们的方法很简单,但仅有2200万参数的IP-Adapter可以

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值