Midjourney学会看图说话!输入图像秒出prompt,网友玩疯了

c6ffc79c89d9b7b079087d656a457dfa.jpeg

来源: 新智源  微信号:AI-era

Midjourney V5上线后,网友们用它生成了数不清的惊叹作品。

在这个AI作画工具面前,人和人的差距,或许就体现在prompt上了。

去年在科罗拉多州博览会艺术比赛上用AI打败了人类的获奖者,花了80多个小时,经过900次迭代后,才用Midjourney完成了《太空歌剧院》这一艺术杰作。而ta直接拒绝分享出自己的prompt。

7f9328a67d0e800667b3dfd2ec71491e.png

是的,现在很多时候,一行完美又专业的prompt,已经价值千金。

而Midjourney仿佛深知我们的需求,最近,它上线了一个新功能——/describe,可以帮我们从图像中反推prompt。

2cba7e897c9574088c9e5c391095242d.png

从图像反推prompt

现在,如果你有一个想模仿的图像,但你不知道要用什么样的prompt去描述它,这时候,describe就帮你大忙了。比如,下图是新海诚的《言叶之庭》(「言の葉の庭」)。

d62ca96a052d2b008327abc418988b30.png

拖进图像后,Midjourney生成了下面四种prompt。

7312e0cd8f88dcc16b00fd9c7f9f75b7.png

根据这四个prompt,Midjourney又生成了类似风格的四幅图。

简直完美。

94245343cadf9b2ec1ced86486882ac6.png

并且,Midjourney提供的描述也可以激发出用户的更多灵感。传统的画家可能会患有空白画布综合征,AI艺术家有时也会词穷,很难找到描述照片的词语。

在Midjourney的Discord频道上,从「/describe」就可以启动文本描述过程了。

a3c9af16da17afae31502e1910a1c9e7.png

Midjourney提供了一个拖放区,可以让你拖入图像。

然后按下回车键,就可以等待prompt了。

e708ce7c64f74dbfd4fba016adf874ff.png

四个文本提示,包括描述性词语、样式详细信息和纵横比。宽高比在像素精确度方面与计算机类似,比如如果是一个16:9的图像,它会输出504:283。

而四个文本提示生成后,你可以直接点击按钮,直接用它们生成图像,当然,在提交之前,你也可以选择自己优化提示。

作家的意外收获?

更有趣的是,Midjourney的这个新功能,竟然意外地让作家们获得了帮手。

如果找不到完美的形容词来描绘一幅画,只需要把图像上传到Midjourney,文采斐然的句子就自动蹦出来了。

而Midjourney返回的文本提示,真是让人惊喜连连。其中包括「palewave」、「cranberrycore」和「icepunk」等流行语,以及各种艺术家、摄影师和作者的姓名。

而提示中出现人名时,甚至是可点击的链接,可以打开谷歌搜索,如果点击进去,你或许会获得更多的灵感来源。

比如,上传Ross Burgener的一张绝佳的作品,Midjourney会这样描述:"极光在LED照明的冰屋上跳舞,给雪的颜色带来了蓝色调"。

f384ee789a4c2bddad6cbbb3fcd69a52.png

它认出了北极光,会在提示中给出建议——可参考艺术家Qlexis Gritchenko和摄影师Nathan Wirth。它采用的词汇包括 「极地冰山」、「发光的天空」和「空灵的雕塑」。

网友们大喜,已玩疯

现在,网友们已经玩疯了。

有网友利用describe功能,生成了许多穿白色蕾丝裙的美女。

48625e7507f49133fab0c66574032dde.jpeg

e7240de793ec39f83130e5c2e270a9de.jpeg

有人输入了一堆珠宝的图像。

dd44a27013846e6abb8bc91f8c690878.png

得到了如下的prompt。

916205d7f42b6d32b76ce41f5900728e.png

根据这些prompt生成的图像如下。

576496a7e289c6d78bfa5a36eefe6d91.jpeg

输入一个二次元萌妹。

28c1f52ab1996a0885361aac81738f63.png

输出的prompt,出图效果很惊艳。

1ace4c1be556f3b07f30db7b4705a995.jpeg

输入一只气质憨憨的大捻角羚的照片。

2759cfeac19f32ae050d420ef40b5547.png

生成的prompt如下。

171010fca93c22b26017dd7791a372a7.png

输出的prompt生成的大捻角羚,气质更为冷峻。

97608b03ba6368f8dc2803119125ec58.png

输入一只海滩上的狗。

aac5b67b83545f82cdfe1baa7dec9594.png

Prompt生出了四只埋在坑里的狗。

3f6c74793336a49c922ef0e0251444b2.png

输入穿着燕尾服的动漫人物。

e11f2cfeee59d1034eeeebedf26af96a.png

生成如下prompt。

9de06d3d58175e1b4932607b6e7af1e3.png

生成四张动漫人物。

e1152d80bc74bda189a53c1a2d5d07be.png

是RLHF?

可以看到,Midjourney最近的进步,可以用飞速形容。

英伟达AI科学家Jim Fan猜测,Midjourney一直在根据人类反馈(「RLHF」)进行大规模的强化学习,并且,这可能是有史以来规模最大的文本到图像强化学习。

当用户选择放大图像时,是因为他们更喜欢它。如果不把这个过程当作奖励信号,那真是巨大的浪费。这些数据收集起来很便宜,而且完全符合用户群的需求。 

拥有的用户越多,可以做的RLHF就越好,然后获得的用户就越多。

e9392893a6c0831948ba6bfb9fce1abe.png

他还给出了一个免责声明,表示这就是自己的一个脑洞,自己并不认识Midjourney的人。

但他们一定已经是这么做的,因为UI的格式看起来就像一个多项选择题。

c00331674841322c33e8ffb3cf77901a.png

最后,要注意的是,同图像生成一样,describe功能需要使用积分,所以需要谨慎地考虑。

而且现在,Midjourney的免费功能,已经彻底关闭了。

参考资料:

https://the-decoder.com/midjourney-new-image-tool-works-in-reverse/

https://twitter.com/DrJimFan/status/1643279641065713665

 
 

e80078e2dab7fea8e66ff141b5cd4c6a.jpeg

 
 
 
 
 
 
 
 
往期精彩回顾




适合初学者入门人工智能的路线及资料下载(图文+视频)机器学习入门系列下载机器学习及深度学习笔记等资料打印《统计学习方法》的代码复现专辑机器学习交流qq群955171419,加入微信群请扫码
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值