![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
AIGC
文章平均质量分 83
资料加载中
迎着风奔跑
展开
-
【AIGC】DiffuToon:稳定的视频卡通化技术方案
diffutoon稳定的视频卡通化技术方案原创 2024-07-03 20:55:37 · 361 阅读 · 0 评论 -
【AIGC】PULID:对比对齐的ID定制化技术
Pulid对比对齐的ID定制化技术原创 2024-06-04 22:29:11 · 1138 阅读 · 0 评论 -
【AIGC】FaceChain:发挥生成式内容的无限可能性
FaceChaine提供了一系列的生成方案,通过少量的图像输入,就能生成逼真的个性化肖像。它是一个个性化肖像生成框架,包含丰富的人脸感知相关的模型,例如人脸检测,深度人脸向量提取,人脸属性分析等等。输入主要的肖像生成功能,社区还包括虚拟试穿,2D数字人功能最近的一些工作都聚焦于使用少量的图像再基础模型的基础上去做微调,让微调网络记住某个特定人物身份信息。这样就可以结合提示词在大模型的基础上得到更多新样式的高保真图像。目前人物为主的个性化肖像文生图方法主要分两种:1.基于lora,2基于人脸身份。原创 2024-06-01 23:51:41 · 805 阅读 · 0 评论 -
【AIGC】IP-Adapter:文本兼容图像提示适配器,用于文本到图像扩散模型
IPAdapter能够通过图像给Stable Diffusion模型以内容提示,让其生成参考该图像画风,可以免去Lora的训练,达到参考画风人物的生成效果。通过文本提示词生成的图像,往往需要设置复杂的提示词,通常设计提示词变得很复杂。文本提示可以由图像来替代。直接微调预训练模型也是一种行之有效的方法,但是需要消耗大量计算资源。并且存在模型兼容性问题。在本文中,我们介绍了IP-Adapter,这是一种有效且轻量级的适配器,用于实现预训练文本到图像扩散模型的图像提示功能。我们的 IP 适配器的关键设计是。原创 2024-01-13 23:56:55 · 4962 阅读 · 11 评论 -
【AIGC】DreamBooth:微调文本到图像扩散模型用于主题驱动的生成
DreamBooth可以让我们使用一个很小的数据集微调文生图模型,然后基于文本提示词为我们训练的的主体替换不同的场景。大型文本转图像模型在人工智能的发展中实现了显著的飞跃,能够从给定的文本提示中高质量和多样化地合成图像。然而,这些模型缺乏模仿给定参考集中受试者外观的能力,也缺乏在不同背景下合成它们的新演绎的能力。在这项工作中,我们提出了一种文本到图像扩散模型的“个性化”新方法。给定一个主题的几张图像作为输入,我们微调一个预训练的文本到图像模型,以便它学会将唯一标识符与该特定主题绑定。原创 2024-01-14 19:28:23 · 1067 阅读 · 0 评论 -
【AIGC】Controlnet:基于扩散模型的文生图的可控性
controlnet可以让stable diffusion的生图变得可控。冻结了stable diffusion的预训练模型并重用它的预训练编码层神经网络结构与零初始化卷积层连接,从零开始逐渐增加参数,并确保微调过程中不会有噪声影响Controlnet在小数据集(小于5张万图)和大数据集(大于100万张图)上的训练表现都是稳定的。原创 2024-01-13 15:16:51 · 1739 阅读 · 0 评论 -
【AIGC】AnimateDiff:无需定制化微调的动画化个性化的文生图模型
Animatediff是一个有效的框架将文本到图像模型扩展到动画生成器中,无需针对特定模型进行调整。只要在大型视频数据集中学习到运动先验知识。AnimateDiff就可以插入到个性化的文生图模型中,与Civitai和Huggingface的文生图模型兼容,也可以与自己微调的大模型兼容。随着文本到图像模型(例如,Stable Diffusion [22])和相应的个性化技术的进步DreamBooth [24] 和 LoRA [13] 等产品,每个人都可以以可承受的成本将他们的想象力体现成高质量的图像。原创 2024-01-14 17:45:10 · 2311 阅读 · 0 评论 -
【AIGC-数字人】V-Express:渐进式训练的数字人视频生成技术
在人像视频生成领域,使用单张图像生成人像视频已经变得越来越普遍。一种常见的方法涉及利用生成模型来增强适配器以实现受控生成。然而,控制信号的强度可能会有所不同,包括文本、音频、图像参考、姿态、深度图等。其中,较弱的条件往往由于较强条件的干扰而难以发挥作用,这对平衡这些条件提出了挑战。在我们关于肖像视频生成的工作中,我们发现音频信号特别弱,常常被姿势和原始图像等更强的信号所掩盖。然而,用弱信号直接训练往往会导致收敛困难。原创 2024-06-01 13:21:16 · 681 阅读 · 0 评论