ControlNet作者新作：AI打光玩得更溜了！细节保留能力远高于SD1.5-CSDN博客

点击下方卡片，关注“CVer”公众号

AI/CV重磅干货，第一时间送达

点击进入—>【Mamba/多模态/扩散】交流群

添加微信号：CVer2233，小助手会拉你进群！

扫描下方二维码，加入CVer学术星球！可以获得最新顶会/顶刊上的论文idea和CV从入门到精通资料，及最前沿应用！发论文/搞科研/涨薪，强烈推荐！

金磊发自凹非寺
转载自：量子位（QbitAI）

ControlNet作者“敏神”（张吕敏），刚刚上新了一个新项目——

名叫IC-Light V2，可以说是把AI打光这事儿玩得溜溜的。

IC-Light是此前张吕敏开发的图像处理工具，可以通过AI技术精确控制图像中的光照效果。

而此次的V2版本则是一系列基于FLUX的IC-Light型号，具有16通道VAE和原生高分辨率。

话不多说，直接来看效果。

例如随意输入一张照片，附上一句Prompt：

flicker 2008 photo of a woman, neon light, city, cars and people in the background.
闪烁2008年的照片，一个女人，霓虹灯，城市，汽车和人的背景。

最终生成的效果可以称得上毫无违和感。

我们再来放大来看下前后的对比，人物细节保留程度就更明显了：

再来看一个例子：

据敏神自己介绍：

IC-Light V2得益于更好的训练方法，细节保留能力远高于SD1.5。

而网友们在看完新工具的效果之后也直呼“世界上最好的重光照（relighting）工具”。

风格化图片也能处理

在之前基于SD1.5的IC-Light，有个问题就是处理带风格的图片的效果并不是非常理想。

例如这样：

可以明显看出，原图是一张美漫风格的图片，而输出的结果却是真人风了。

而且即使在Prompt中给到了关键词“surrealist painting of（超现实主义绘画）”，得到的风格依旧还是带点漫画风。

嗯，AI直接把这个关键词给忽略掉了。

而现在，基于FLUX的IC-Light V2，已经弥补了此前的缺陷。

除了人物之外，敏神也展示了其它主体的效果。

在线可玩

目前，IC-Light V2已经上线HuggingFace，可以在线体验。

下面是我们实测马斯克照片的例子：

除此之外，敏神此次推出的IC-Light V2其实是一个系列的模型。

目前可以体验的版本是一个foreground conditioned model（前景条件模型），强调的是保留输入图像细节。

还有三个模型在陆续发布：

还是一个前景条件模型，但强调支持较大的修改，例如处理低光图像和更改硬阴影。
一个前景和背景条件模型
与环境HDRI集成的模型

最后，敏神对于这次的模型还补充道：

目前的模型只能在HuggingFace上体验，稍后会发布更多的推理代码和权重。

然而，与V1不同的是，该许可证将仅用于非商业用途。

体验链接放下面了，感兴趣的小伙伴可以尝鲜一波哦~

体验地址：
https://huggingface.co/spaces/lllyasviel/iclight-v2

参考链接：
[1]https://github.com/lllyasviel/IC-Light/discussions/98
[2]https://x.com/multimodalart/status/1850521222213218380?s=46&t=6eepxw1G6XRQ7VO0ANjJWg

何恺明在MIT授课的课件PPT下载

在CVer公众号后台回复：何恺明，即可下载本课程的所有566页课件PPT！赶紧学起来！

ECCV 2024 论文和代码下载

在CVer公众号后台回复：ECCV2024，即可下载ECCV 2024论文和代码开源的论文合集

CVPR 2024 论文和代码下载

在CVer公众号后台回复：CVPR2024，即可下载CVPR 2024论文和代码开源的论文合集

Mamba、多模态和扩散模型交流群成立

扫描下方二维码，或者添加微信号：CVer2233，即可添加CVer小助手微信，便可申请加入CVer-Mamba、多模态学习或者扩散模型微信交流群。另外其他垂直方向已涵盖：目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer、NeRF、3DGS、Mamba等。
一定要备注：研究方向+地点+学校/公司+昵称（如Mamba、多模态学习或者扩散模型+上海+上交+卡卡），根据格式备注，可更快被通过且邀请进群

▲扫码或加微信号: CVer2233，进交流群
CVer计算机视觉（知识星球）来了！想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料，欢迎扫描下方二维码，加入CVer计算机视觉（知识星球），已汇集上万人！

▲扫码加入星球学习

▲点击上方卡片，关注CVer公众号
整理不易，请赞和在看

ControlNet作者新作：AI打光玩得更溜了！细节保留能力远高于SD1.5

金磊 发自 凹非寺转载自：量子位（QbitAI）

风格化图片也能处理

在线可玩

金磊发自凹非寺
转载自：量子位（QbitAI）