ControlNet仅靠一张照片完成“旧房改造”!GitHub热榜第一

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>【计算机视觉】微信技术交流群

Alex 发自 凹非寺
转载自:量子位(QbitAI)

这是同一个房间改装前后的样子:

b16b92c08792d6213b9b9c6ba034a7e1.png

一下子质感Up,从凌乱过时变成了有腔有调的现代风。

至于设计费嘛,其实是…一分钱都没花!

因为这并不是专业设计师做的方案,而全靠一只AI完成。

——只用给AI一张照片,它就能搞定的那种。

还可以选择不同风格。

e7bb9a28a77d206b779a49d4e0603f6f.png

如此实用的“旧房改造”AI,很快引来大波网友驻足围观;原帖登上了GitHub热榜第一,目前已收获2700+颗星。

b6adb01c7d041725d10981df036cd1fb.png

还在HackerNews上引起热议。

有网友称,这个应用让他觉得很惊喜,并表示:

如果这种AI还能添加一些功能就更好了,比如给生成图片中各设施进行估价,这样就有机会落地商用了。

dedb26f2efd5d3a572cd32622e71a6e5.png

还有网友指出:

这实际上就是一种生成式预训练Transformer,和其他Transformer本质是一样的。

f8f3df4768b5f7e22666f2233da5233b.png

一张图就能搞定房间设计

不管怎么说,这个AI确实在现有技术上整出了实用且新颖的用法。量子位没忍住也亲自上手试了试

我先找来几张破旧房间的照片,然后开始和AI共同设计改造。

说是共同改造,但其实我要做的,就只用给AI一张图,然后点击两个选项:风格和房间用途。

比如,这里选择现代风的客厅:

88dc4d7547375d174068ab74ccdd93d5.png

几秒钟后,我眼前一亮。不仔细对比左右两张图的格局,真的很难相信这是同一个房间。

04418d624eb6e3c3de13a7d1e9d01bb3.png

除了现代风,还有其他选择,于是我又试了试极简风:

0791bc42a556aa8c32bd628855fe8b45.png

虽然这似乎不太“简”,但很精美,甚至比上面的现代风更胜一筹。(给我看得都心动了…)。

不过需要说明的是,目前此AI一个IP每天最多只能用3次——实在想多弄几张的话,可以换台电脑。2fdd60a0f98f303f40b93100b6c7fca6.png

9060f5ab209f5b11646eea641dc3958b.png

看到这里,话说一只小小的AI,为何短短几秒就能设计好一整个房间?

其实,这主要得益于它背后一种强大的新晋机器学习模型:ControlNet

ControlNet,由斯坦福大学研发,是一种通过添加额外条件,来控制扩散模型的神经网络。

这个模型,可以将神经网络块的不同权重,分别复制到“锁定”副本(locked copy)和“可训练”副本(trainable copy)中。

锁定副本,会保留输入信息的一些关键特征;可训练副本,则会通过训练、学习来调节其他特征。然后,这两部分还会连接起来协同工作。

411d201ee33d92fc90fc2e75082b197a.png

对于可训练副本而言,其训练的方向包括:物体的准确边缘、语义分割、人体姿势等等。

简单来说,就是AI能够判定,一张图中各个要素是否可以改变;然后会在原图某些核心要素不变的前提下生成新的内容,不会导致生成图和原图看起来毫无联系。

另外,这个模型搭配文字“食用”效果更佳——比如刚才我选择的房间用途和装修风格,其实就是在给AI添加一点文字提示。

总而言之,基于这样的原理,ControlNet不仅可以胜任室内设计,还有可以玩出别的花样。

比如,一键涂色:

287d0ebbb9927051166d4508aedc1e4a.png

还有“一键换猫”(猫换了,但可爱的歪头杀不变):

5d31585925285fe93258f90bd3cd2620.png

“一键换牛”:

2a12e1a18d1a4fc1e1aeb950347d762d.png

Emmm,那某些游戏皮肤是不是……?53b10de2ade767bef4f2700e001f56a2.png

值得一提的是,如果你嫌专门登陆官网(见传送门)比较麻烦,可以通过API将这个AI应用连到你的本地应用上。

按这种用法,首先需要下载数据库。

git clone https://github.com/Nutlope/roomGPT

接着去Replicate网站上创建一个帐户,并获取 API 密钥。注意,然后需要把将API 密钥存储在 .env 文件中,如 .example.env。

再安装依赖项:

npm install

然后你就能在命令行中运行该AI了:

npm run dev

开发者简介

最后,来认识一下此AI的幕后开发者:其实一共就3个人。

23e5359dd1ec03759a262bd873946450.png

其中,最主要的贡献者Hassan El Mghari,本科毕业于德雷塞尔大学计算机工程系,现在是一名全栈软件工程师。

14c625aeb663b21b316aa36f81bb0051.png

除了开发各种应用,这哥们儿还曾创立了一家游戏营销公司,在Steam上拥有500,000+名用户。

官网传送门:
https://www.roomgpt.io/
Relicatec传送门:
https://replicate.com/
参考链接:
[1]https://github.com/Nutlope/roomGPT
[2]https://news.ycombinator.com/item?id=35001046
[3]https://levelup.gitconnected.com/controlnet-control-your-ai-art-generation-616c86c88964
[4]https://www.elmghari.com/about

点击进入—>【计算机视觉】微信技术交流群

最新CVPP 2023论文和代码下载

 
 

后台回复:CVPR2023,即可下载CVPR 2023论文和代码开源的论文合集

后台回复:Transformer综述,即可下载最新的3篇Transformer综述PDF

扩散模型和GAN交流群成立
扫描下方二维码,或者添加微信:CVer333,即可添加CVer小助手微信,便可申请加入CVer-扩散模型和GAN 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。
一定要备注:研究方向+地点+学校/公司+昵称(如扩散模型和GAN+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群

▲扫码或加微信号: CVer333,进交流群
CVer学术交流群(知识星球)来了!想要了解最新最快最好的CV/DL/ML论文速递、优质开源项目、学习教程和实战训练等资料,欢迎扫描下方二维码,加入CVer学术交流群,已汇集数千人!

▲扫码进群
▲点击上方卡片,关注CVer公众号
整理不易,请点赞和在看
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值