ControlNet作者新作:AI打光玩得更溜了!细节保留能力远高于SD1.5

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>【Mamba/多模态/扩散】交流群

添加微信号:CVer2233,小助手会拉你进群!

扫描下方二维码,加入CVer学术星球!可以获得最新顶会/顶刊上的论文idea和CV从入门到精通资料,及最前沿应用!发论文/搞科研/涨薪,强烈推荐!

470ae9bbfcc104ccaddace035b0cdfbd.png

金磊 发自 凹非寺
转载自:量子位(QbitAI)

ControlNet作者“敏神”(张吕敏),刚刚上新了一个新项目——

名叫IC-Light V2,可以说是把AI打光这事儿玩得溜溜的。

107d291534096a1b63dbba5a78421954.png

IC-Light是此前张吕敏开发的图像处理工具,可以通过AI技术精确控制图像中的光照效果。

而此次的V2版本则是一系列基于FLUX的IC-Light型号,具有16通道VAE和原生高分辨率。

话不多说,直接来看效果。

例如随意输入一张照片,附上一句Prompt:

flicker 2008 photo of a woman, neon light, city, cars and people in the background.
闪烁2008年的照片,一个女人,霓虹灯,城市,汽车和人的背景。

3f2bc2a538bd2aaec70cc0bf7ecbd900.png

最终生成的效果可以称得上毫无违和感。

我们再来放大来看下前后的对比,人物细节保留程度就更明显了:

d7f635ea39da6597aac6a462793c4b72.gif

再来看一个例子:

75b743fe67fcc53a750d8b3a4307ed6b.gif

据敏神自己介绍:

IC-Light V2得益于更好的训练方法,细节保留能力远高于SD1.5。

而网友们在看完新工具的效果之后也直呼“世界上最好的重光照(relighting)工具”。

8457e0323649fe7cb64661894000ec34.png

风格化图片也能处理

在之前基于SD1.5的IC-Light,有个问题就是处理带风格的图片的效果并不是非常理想。

例如这样:

5e6e77ec946a30a74179ddb1d6e809a6.png

可以明显看出,原图是一张美漫风格的图片,而输出的结果却是真人风了。

而且即使在Prompt中给到了关键词“surrealist painting of(超现实主义绘画)”,得到的风格依旧还是带点漫画风。

嗯,AI直接把这个关键词给忽略掉了。

62ceca981fa150a7e3d3efc430068390.png

而现在,基于FLUX的IC-Light V2,已经弥补了此前的缺陷。

1b6c9f5bc90a0ab2a40e15a0b2271ab2.png
1e8cf89a7f499460d31aa43409ae973e.png
66d00bd3815dbe9a9f438790e6199d22.png

除了人物之外,敏神也展示了其它主体的效果。

72a39adfd2746c4a8c5d734c7eec62b0.png
0815ba79d426b209a73c65f23d152766.png

在线可玩

目前,IC-Light V2已经上线HuggingFace,可以在线体验。

下面是我们实测马斯克照片的例子:

686c4e09cdf41c89f0cb7d4d89c86a75.png

除此之外,敏神此次推出的IC-Light V2其实是一个系列的模型。

目前可以体验的版本是一个foreground conditioned model(前景条件模型),强调的是保留输入图像细节。

还有三个模型在陆续发布:

  • 还是一个前景条件模型,但强调支持较大的修改,例如处理低光图像和更改硬阴影。

  • 一个前景和背景条件模型

  • 与环境HDRI集成的模型

最后,敏神对于这次的模型还补充道:

目前的模型只能在HuggingFace上体验,稍后会发布更多的推理代码和权重。

然而,与V1不同的是,该许可证将仅用于非商业用途。

体验链接放下面了,感兴趣的小伙伴可以尝鲜一波哦~

体验地址:
https://huggingface.co/spaces/lllyasviel/iclight-v2

参考链接:
[1]https://github.com/lllyasviel/IC-Light/discussions/98
[2]https://x.com/multimodalart/status/1850521222213218380?s=46&t=6eepxw1G6XRQ7VO0ANjJWg

 
 

何恺明在MIT授课的课件PPT下载

 
 

在CVer公众号后台回复:何恺明,即可下载本课程的所有566页课件PPT!赶紧学起来!

ECCV 2024 论文和代码下载

在CVer公众号后台回复:ECCV2024,即可下载ECCV 2024论文和代码开源的论文合集

CVPR 2024 论文和代码下载

在CVer公众号后台回复:CVPR2024,即可下载CVPR 2024论文和代码开源的论文合集

Mamba、多模态和扩散模型交流群成立

 
 
扫描下方二维码,或者添加微信号:CVer2233,即可添加CVer小助手微信,便可申请加入CVer-Mamba、多模态学习或者扩散模型微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer、NeRF、3DGS、Mamba等。
一定要备注:研究方向+地点+学校/公司+昵称(如Mamba、多模态学习或者扩散模型+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群

 
 
▲扫码或加微信号: CVer2233,进交流群
CVer计算机视觉(知识星球)来了!想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料,欢迎扫描下方二维码,加入CVer计算机视觉(知识星球),已汇集上万人!

▲扫码加入星球学习
 
 
▲点击上方卡片,关注CVer公众号
整理不易,请赞和在看
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值