Midjourney V5来了! 与第4版相比,第5版有什么新突破呢?
微信搜索关注《Java学研大本营》,加入读者群,分享更多精彩
AIGC有望颠覆许多行业,Midjourney V5带来了许多变革,本文逐一进行介绍。
几天前,Midjourney发布了第5版(MJ V5)的alpha测试版,供人们体验和尝试。这个版本的神经架构和AI技术与之前的版本有很大不同,新版本的所使用的截然不同的神经架构和崭新的视觉技术引发了人们的高度期待!
不过这只是一个alpha测试版本,这就意味着该模型在最终发布之前还将经历一系列修改。
本文将探讨如何激活MJ V5,它与MJ V4相比有哪些改进,以及还有哪些需要继续改进的地方。
接下来让我们深入了解一下。
激活MJ V5
要开启MJ V5,请输入以下命令:
--v 5
在提示语后面,使用/settings
命令并选择MJ version 5
。
从/settings中激活MJ第5版
比较MJ V4与MJ V5
MJ V4的主要问题之一是生成的手的质量不佳,往往是畸形的。
使用同样的提示语来生成MJ V4 和MJ V5的图像,查看是否有改进。将使用的提示语如下所示:
hands of a woman, red nail polish --no ugly, malformed
提示语:“hands of a woman, red nail polish — no ugly, malformed”
如图所示,可以看到很大的区别。MJ V5的输出更加逼真和自然,手部明显得到了改善。并且,图像的分辨率更高。MJ V5生成的图像的分辨率是MJ V4的2倍。但是当使用U1 button
对图像进行升级放大时,分辨率并没有提高。
现在生成一张女性的肖像,看看这些图像是否真的比MJ V4看起来更真实。输入的提示语是:
a beautiful woman with a red hat smoking a cigarette, wearing a white dress, intense sight, cinematic lighting, dark background, hyper-realistic, hyper-detailed, 8k - no malformed, doubled, low, ugly"
提示语:“a beautiful woman with a red hat smoking a cigarette, wearing a white dress, intense sight, cinematic lighting, dark background, hyper-realistic, hyper-detailed, 8k — no malformed, doubled, low, ugly”
当比较这两个版本时,MJ V5的输出绝对是更真实的。手部看起来也更好!
再关注一下颜色。MJ V4的另一缺点是模型不能完全理解颜色。当提示中提到一种以上的颜色时,模型会更重视其中一种而不是所有颜色。虽然有时可能会得到想要的内容,但这是非常随机的。
查看前面的输出,貌似这个问题在MJ V5中仍然存在。图中可以看到“白色”似乎比“红色”更占优势。
尝试一些小技巧,例如在颜色和对象之间添加一个加号(+),观察是否有所改进。
a beautiful woman with a red+hat smoking a cigarette, wearing a white+dress, intense sight, cinematic lighting, dark background, hyper-realistic, hyper-detailed, 8k - no malformed, doubled, low, ugly
提示:"a beautiful woman with a red+hat smoking a cigarette, wearing a white+dress, intense sight, cinematic lighting, dark background, hyper-realistic, hyper-detailed, 8k - no malformed, doubled, low, ugly"
第三张图片是唯一符合我们提示的图片。尝试通过添加"::2 "来赋予红帽子更多的重要性。
a beautiful woman with a red+hat::2 smoking a cigarette, wearing a white+dress, intense sight, cinematic lighting, dark background, hyper-realistic, hyper-detailed, 8k - no malformed, doubled, low, ugly
提示:"a beautiful woman with a red+hat::2 smoking a cigarette, wearing a white+dress, intense sight, cinematic lighting, dark background, hyper-realistic, hyper-detailed, 8k - no malformed, doubled, low, ugly"
输出结果有所改善,但颜色还是需要改进的地方。这并不是V5最终版本,所以Midjourney仍然可以带来更多惊喜!
结论
本文探讨了如何激活MJ V5,它比MJ V4带来了哪些改进,以及哪些地方需要继续改进。
虽然V5在真实度、分辨率和手感方面都有明显的改进,但颜色的问题仍然存在。不过这只是一个alpha测试版,最终版本可能会有很大的提升空间。
推荐书单
《Netty源码全解与架构思维》
Netty是目前市面上使用率较高的网络编程库。它的架构设计非常明确且层次分明,源码较为易懂,其中包装了Java NIO(New IO,新IO)的三大组件:Selector、Channel、ByteBuffer,提供了简单易用高效的网络通信库,其中还实现了自己的内存池管理。Netty的设计基于Jemalloc内存管理库,同时也实现了很多开封即用的应用层协议编码与解码器。本书通过常用的TCP协议完整诠释了Netty的架构设计与思想,省略了Java语言层面的一些基础知识,例如变量、面向对象、泛型等Java SE的基础。
本书适用于以下读者:希望进入互联网公司工作的读者、研究Netty底层知识的读者、在工作中遇见瓶颈,希望通过学习Netty提升底层知识的读者、从事开发高并发支撑中间件的读者、从事互联网高并发业务支撑的读者、对多线程编程感兴趣的读者、希望通过Netty源码找到调优点的读者。
精彩回顾
微信搜索关注《Java学研大本营》
访问【IT今日热榜】,发现每日技术热点