整理 | 彭慧中 责编 | 屠敏
出品 | CSDN(ID:CSDNnews)
最近在AI界,每个人或许都应该都听说过这款当下最酷的AI模型 DALL·E 2。它堪称AI界的绘画大师,“恐让艺术家们集体失业”的言论传得沸沸扬扬。
去年,OpenAI开源了DALL·E,它能够从文本生成图像,效果已足够惊艳。然而,在今年4月,升级版DALL·E 2问世了,这一年内的进步也不可小觑!DALL·E 2不仅能够更好地从文本生成照片级真实的图像,而且分辨率提升了四倍!
跃跃欲试的开发者早已在门外排起了长队,大家都想对DALL·E 2真实能力一探究竟。而就在几周前,访问的“大门”已经打开,等待名单上的很多人都得到了访问权,这群人也包括今天的主人公:Jacob Martin,他用DALL·E 2为自己所开发的开源软件“OctoSQL”设计了一个Logo,一起来看看AI的能力是否真的能取代设计师吧。
为数据查询工具设计Logo
Jacob Martin花了一天时间,通过学习了一些基本知识来进行“热身”。学会操作后,Jacob Martin就着手给自己的开源项目OctoSQL(一个CLI查询工具,可在一个SQL查询中查询多个数据库和文件格式)设计Logo了。
先给大家展示一下最终的设计成果:
接下来,Jacob Martin将介绍自己是如何得到这张他所钟爱的Logo图的。
首先,他先介绍了DALL·E 2的运作方式:一开始,你会得到一堆免费的积分点数,当然你可以购买更多的积分。一个积分可以让你做以下事情:
-
生成:为一个给定的短语生成4张图片。
-
编辑:为一个给定的短语和原始图像生成3张图像,并将区域标记为透明(可以使用图像编辑软件,或使用内置的透明化工具)。
-
优化:基于给定的图像生成3个变化,但不提供短语。这意味着你不能对DALL·E 2说:“给我复制一个上述图片,并且做xxx方面的修改”这样的事情,除非你能先在第二个步骤中通过标记一个透明区域来实现。
Jacob Martin对他的Logo有一个相当具体的想法,但他却无法用语言来具体描述它。“OctoSQL”这个名字来源于“章鱼”和“SQL”,其想法是章鱼有许多手臂,可以同时抓取许多物品,就像“OctoSQL”可以同时操作许多数据源一样。
所以Jacob Martin最初想要实现的是一个可爱卡通的章鱼玩弄一堆数据库(或能代表数据库的标志,并且他决定不使用数据库的实际标志)。
因此,他第一次输入如下短语:小章鱼玩弄数据库、数字艺术、卡通、绘图的图表,得到了以下的图片。
Jacob Martin对初次尝试就得到了这样一些可爱的图像感到惊喜,并希望再做一些其他的改变,得到了以下图片:
尽管它确实看起来很卡通,但Jacob Martin更希望它们能更有内涵一些。然而,主要的问题是,这些章鱼是拿着图表的,而OctoSQL并不处理图表,它处理的是数据。这可能会让人对OctoSQL的用处产生误解。
于是,Jacob Martin打算为章鱼添加一些抽象的形状。他尝试输入了抽象的立方体来表达抽象的数据,又因为OctoSQL是一个重视数据安全的严肃的数据库,因此后来又给章鱼宝宝加上了黄色的安全帽来激发人们的信心,再后来又加上了黑暗的圆圈作为背景....
DALL·E 2也按照他的要求一步步输出了如下的图片:
最终,而正如大家在一开始看到的,最后一排中间的那张赢了。小章鱼正在操纵一些物体,它相当可爱,黄色安全帽也能激发人们的信心,而且没有其他微小的元素,远看令Jacob Martin很满意,经过他的微调之后就得到了文章开头的那个Logo。
Jacob Martin表示,总而言之,这是一个有趣的体验。尽管最终的结果并非完美,但他也已经非常满意了。就DALL·E 2而言,他认为现在它的重点功能和目的都在“首次描绘”阶段。并且,从目前来看,艺术家还没有什么可担心的(这与Copilot的情况很相似)。
从花费的角度来看,Jacob Martin为整个事情花费30美金,也不算太多。但他认为真正的突破将在DALL·E 2变得便宜10-100倍,并且能更快地输出图片时出现。
DALL·E 2对艺术家们有没有威胁?
Jacob Martin的尝试性实验引起了Hacker News上的广泛讨论,600多人都发布了对于DALL·E 2这位“AI 绘画大师”的评价。
一部分网友认为DALL·E 2尽管没有传说中那么神乎其神,但却可以帮助人类更高效地获得自己想要的图像:
@woah:这篇博文证明了Dall-E 2不会使人类的品味和设计能力被淘汰。他最终得到的图像比大多数的中间步骤要丑陋和复杂得多。我认为生成图形的艺术AI将对设计产生类似于编译器对软件开发的影响,并且不会使艺术家失业。
@burlesona:我对DALL·E 2很着迷,这就像与一个人类艺术家合作一样,他并不真正了解你想用图像来表达的领域。
但最有价值的事情,是它可以比人类更快更容易地完成一些早期的探索,得到两三个感觉像是在附近的概念,然后让人类专家接手,把它变成最终的成品。这很不错。
然而也有一部分网友认为,DALL·E 2对于要求不高的客户来说,还是有受众的,且随着技术进步,未来对于艺术家们的威胁性如何也未尝可知。
@deebosong:很多客户的品味有问题,而且我确实可以看到很多对视觉不敏感的人对这些DALL·E 2画的章鱼标志的迭代非常满意。大多数人不知道也不关心什么才是好的图形设计。
首先,这个最终的标志不能扩展。另外,颜色缺乏细微差别和和谐。这个标志更像是一本儿童读物的插图,而不是简单、大胆、聪明,可以贴在任何媒体上的东西。
不过我敢打赌,再过10-15年,对于平面设计师/艺术家/插画师同行来说,随着这些技术更加先进,事情可能会变得有点棘手。
参考链接:
https://jacobmartins.com/posts/how-i-used-dalle2-to-generate-the-logo-for-octosql/
https://news.ycombinator.com/item?id=32320491
《新程序员001-004》已全面上市,欢迎扫描下方二维码或点击进入立即订阅,即可畅享电子书及精美纸质书