腾讯开源AI工具PhotoMaker,无需训练模型就能保持脸部一致随意换装。
最近,AI文本到图像生成领域取得了显著进展,然而,现有的个性化生成方法已经无法同时满足用户的需求,这次腾讯发布了PhotoMaker框架,可以在无需训练lora模型的情况下,把图像随意更换风格并能保持脸部一致,迅速获得了广大网友的青睐。
PhotoMaker 主要通过将任意数量的输入图像编码成堆叠的ID嵌入来保存信息。这种嵌入不仅可以全面封装人物特征,还可以容纳不同 ID 的特征以便后续集成。光是听起来就高大上呀
它的工作原理是从文本编码器和图像编码器分别获得来源,通过合并和提取相应类的ID嵌入。从而很好地生成统一ID的内容
简单来说,PhotoMaker能够在保留人物特征的情况下,轻松更换多种风格也不失真,同时,它还满足高质量输出,最终出来的效果相对好很多。并且还支持更换年龄和性别,大家有什么想法了吗?
PhotoMaker的发布,使得在AI图像生成领域上再度创新,相信未来,这AI技术会在许多行业里发挥重要的作用。