“请给我一个五彩斑斓的黑”,只需一行命令就能让AI画画,OpenAI的Dall-E被大神复现...

晓查 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

OpenAI今年1月公布的Dall-E可谓艳惊四座,只需输入一段话,就能根据内容输出一幅画。连吴恩达老师都不禁点赞。

比如让它设计一个“像牛油果一样的座椅”。

但是,OpenAI只在官网设置了几种固定模板,代码也没有开源,用户无法用AI设计出更多的图片。

不过现在有个好消息,一位华人小哥Philip Wang已经复现了一个PyTorch版Dall-E,叫做Deep Daze

他使用了OpenAI的CLIP以及斯坦福大学的Siren,可以在个人电脑上运行。

只需输入在命令行中输入一段描述,这个AI就能画出各式图片。

比如在绿色山丘上的薄雾(mist over green hills):

或者是“草地上的碎盘子”(shattered plates on the grass):

你觉得实际效果如何?

开发该项目的Philip Wang,就是在今年年初公布要复现Dall-E的那位大神,没想到不到3个月的时间,这个项目已经如此强大,在GitHub上已收获1.1k星。

安装与使用

Deep Daze可直接通过pip安装:

pip install deep-daze

安装完成后,输入以下命令运行。

imagine TEXT <flags>

‍‍其中imagine是命令,TEXT必须是一段不超过77个字符的英文描述,<flags>为可选参数,可加可不加。

如果我们想生成文章开始那张山中薄雾的图片,就输入以下命令:

imagine mist over green hills

<flags>中可加入的参数有:—deeper,获取更高的图像质量;—num-layers,指定网络的层数……更多用法可以去GitHub项目主页查询。

如果担心AI的想象力过于天马行空,可以指定一张图片,让AI在此图像基础上想象。这样就能保证图像不至于太过离谱。

具体的命令如下:

imagine ‘description’ —start-image-path /path/to/picture.jpg

假设我们给AI一张披萨的图片,让它想象“上面铺满青椒的样子”。

那么我们将上述命令中的描述改成“A pizza with green pepper”。

你以为这就是Deep Daze的全部?其实,它还有一个更强大的完全体——故事模式

只需设置—create_story=True,就可以解锁该模式,取消77个字符的限制,项目作者将美国诗人罗伯特·弗罗斯特的诗《雪夜林边歇马》输入其中,得到了一段mp4视频。

到这里我有点想让AI画一下“五彩斑斓的黑”,但贫穷限制了我的操作。

因为使用Deep Daze必须要安装CUDA,而且最好在不小于8GB显存的GPU上,才能获得不错的效果。而我现在根本买不起英伟达显卡。

项目地址:
https://github.com/lucidrains/deep-daze

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

推荐阅读

召唤最强的智,昇腾射出一支产业「穿云箭」

这家刚拿了1亿美元的基金会,要证明“21世纪是生物的世纪”

加入AI社群,拓展你的AI行业人脉

量子位「AI社群」招募中!欢迎AI从业者、关注AI行业的小伙伴们扫码加入,与50000+名好友共同关注人工智能行业发展&技术进展

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见~

  • 17
    点赞
  • 66
    收藏
    觉得还不错? 一键收藏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值