AI 从32张图 学画风!工程师:别总拿维权说事,这同样是创作!

金磊 明敏 发自 凹非寺  量子位 | 公众号 QbitAI

学废一位人类插画师,AI只用了32张作品。

故事的主人公叫做Hollie Mengert(霍姐),她自打2011年从艺校毕业以来就从事着插画相关工作。

11年来的打拼,也让霍姐在插画上有了自己独树一帜的风格。

然鹅……

有天霍姐一觉醒来却收到朋友的来信:“姐~你现在成人家AI的模型了”。

于是乎,毫不知情的霍姐便去Reddit上看了看到底是咋回事,结果——

有位小哥搞了个AI,只用了霍姐32张作品训练,就能模仿她的风格作画!

3b316e94bd10ca09d1c8ab5bbcf1d9f9.png
左:霍姐作品;右:AI作品

好了,这下子大家都能用这个AI,画出霍姐风格的插画了。

956e9915b06ab389bf138ec065092a74.gif

而且更“致命”的是,给AI输入的提示词必须带上“holliemengert artstyle”(霍姐风)……

(多冒昧啊……)

这波操作也是直接让网友炸了锅,纷纷留言为霍姐抱不平:

人家还活着呢……

361323ba8818a163b5423da410512ae0.jpeg

你可把这位姐妹坑惨了

ab985fb8db7f52c8c722c2214bf975cc.jpeg

然后随着这事的逐渐发酵,细节也逐渐浮出了水面。

2.5小时炼出新模型,成本不到15块

事情最初只是一位来自加拿大的工程师Ogbogu Kalu(卡哥),出于个人爱好做了个插画AI。

看着效果还不错,他就把模型发到了Reddit上,结果一下子火了!

09d1ca56cabd7e35216475abaf9064a1.jpeg

不少网友看了直呼:这是巨作!

本以为需要成千上万张图才能训练出好的效果,没想到这么点儿也可以。

4e2cda09383bec32b915b61d12fc6792.jpeg

而且训练成本也很低,卡哥说自己做这个模型,只是在云端租了GPU、花2个半小时就搞定了。

折算成本不到2美元(人民币约15块)。

不过,卡哥当时做出这个AI也实属意外,在此之前他并不了解霍姐的作品。选择这一风格,只是因为他在帮别的网友微调模型,那位网友给出的风格和霍姐画风相似。

通过改进数据集,他一晚上便弄出了一个效果更好的新模型,命名为“hollie-mengert-artstyle”。并把代码也放了出来,人人都能免费试玩。

他用到的AI,主要是Stable Diffusion和DreamBooth

后者是模仿风格精髓的关键。

这是谷歌在今年8月发布的新AI。它只需3-5张图片,再加上文字表述,就能让指定物体迁移到其他场景或风格中去。

eab1832aa0e029ac070946b3b50e5ff7.png

和Dall-E 2、Imagen等最大的不同是,DreamBooth能对选定对象忠实还原

具体方法是给物体加上“特殊标识符”。

原本图像生成模型收到的指令只是一类物体,例如[cat]、[dog]等,但现在DreamBooth会在这类物体前加上一个特殊标识符,变成[V][物体类别]。

以下图为例,将用户上传的三张狗子照片和相应的类名(如“狗”)作为输入信息,得到一个经过微调的文本-图像扩散模型。

该扩散模型用“a [V] dog”来特指用户上传图片中的狗子,再把其带入文字描述中,生成特定的图像,其中[V]就是那个特殊标识符。

fa179ee600041494c40619076b5c459d.png

而且这种方法不局限于某个模型,Dall-E 2、Stable Diffusion等调整后也能实现如上效果。

比如之前亚马逊工程师就发布过一个DreamBooth-Stable-Diffusion。

Hugging Face上这类模型超级多,各种风格都有,如迪士尼、赛博朋克等等。

bab38440965a6b38219aae7b08968a3b.png

卡哥的模型也属于其中之一。

实际上,把DreamBooth用在Stable Diffusion不算难,油管就有现成教程。

39a311ceaed5f564b8a8fc1593bf00b6.png

有人用30张图微调模型,全程不到20分钟,并且效果是杠杠好,他的照片可以毫不违和地融入到各种风格中去。

3df4e972761990dc282039f501b8e7ea.png

(不过芝麻街这个很难判断效果到底好不好1bc6adfe2eb044bc43457d5f7a44eb1d.png

“原作与此无关”

毕竟这事在圈里被讨论得甚是火热,一位叫Andy Baio的吃瓜网友,就直接找到了两位当事人聊了聊。

首先,霍姐谈了谈她的看法:

我得知这件事情的第一反应,就是觉得我名字出现在这个工具里,有被冒犯到

我对这件事情一无所知,也没人征求过我的意见。

即便他过来问我“是否可以这么做”,我也不会答应的。

霍姐认为,给AI训练所用到的图像就涉及到了版权问题。

因为当初她是和迪士尼等客户有合作,没有客户的允许,霍姐自己都不能随意在网上传播插画。

4254678daf41c3c0b2da0ffb489090db.png

除此之外,霍姐还认为这个AI模型跟她的名字挂钩,但并不能完全展现她插画风格的独到之处:

作为一名艺术家,我觉得让我特别自豪的地方,就是作品能有真实的表达、吸睛的设计,并且人物能够产生共鸣。

但AI生成的插画,就挺难做到这些点的。

abff7915deb5f0d669ddf9e5ee7411a4.png

然后霍姐更细致的对这个观点做展开:

我觉得AI可以模仿笔刷的纹理和渲染、选择一些颜色和形状,但这并不代表就能胜任一个值得被雇佣的插画家或设计师。

因为渲染、笔触和颜色等,都是艺术最表层的部分。我认为人们最终会与艺术联系在一起,是因为一个可爱或让人产生共鸣的角色。

总而言之,霍姐个人觉得AI生成的作品跟自己的艺术水平还是有很大的距离感。

但让她非常无奈的是,自己的名字确确实实就跟AI“捆绑”到了一起,成了工具的一部分。

那么站在工程师的角度,又如何看待这件事呢?

Andy Baio也找到了卡哥聊了聊:

我认为AI的训练和图片的使用都是合法的,即便这事闹到法庭也很可能被判为“合理”,因为你是没法给一种画风申请版权的。

100TB的训练数据压缩成一个4GB的模型,AI作画的方式也不能算“缝合”,更像是从生动记忆中提取并创新。

而且这是技术发展不可避免的事情,像Adobe在PhotoShop里搞AI工具,微软也在自家设计套件里添加了图像生成器。

那这就意味着艺术家们对自己的作品就没有发言权了吗?Andy Baio继续追问道。

卡哥对此表示:

我觉得现在很多的反对意见是无解了AI的运作方式。

AI生成的内容并不是基于艺术家作品的拼贴,而是创造了全新的图像,这是一种变革。

对AI不够了解的人没有真正意义上的发言权。

不过后来,卡哥还是把Hugging Face上模型的名字,从最初的Hollie-mengert-artstyle,改成了更为通用的Illustration-Diffusion。

并且还特意补充、强调了一句:

Hollie与此无关。

而在此数天之后,卡哥又发布了一个新模型。

这次他所采用的是另一位艺术家James Daly III的40张作品来训练:

cced5e8e182dc53d00909c8368479835.png
左:James Daly III作品;右:AI生成作品

……

那么对于这件事,你怎么看呢?

参考链接:

[1]https://waxy.org/2022/11/invasive-diffusion-how-one-unwilling-illustrator-found-herself-turned-into-an-ai-model/
[2]https://www.reddit.com/r/StableDiffusion/comments/yaquby/2d_illustration_styles_are_scarce_on_stable/
[3]https://news.ycombinator.com/item?id=33422990
[4]https://huggingface.co/ogkalu/Illustration-Diffusion

猜您喜欢:

深入浅出stable diffusion:AI作画技术背后的潜在扩散模型论文解读

c2d714e07ae39083ca7be6c8e852f029.png 戳我,查看GAN的系列专辑~!

一顿午饭外卖,成为CV视觉的前沿弄潮儿!

最新最全100篇汇总!生成扩散模型Diffusion Models

ECCV2022 | 生成对抗网络GAN部分论文汇总

CVPR 2022 | 25+方向、最新50篇GAN论文

 ICCV 2021 | 35个主题GAN论文汇总

超110篇!CVPR 2021最全GAN论文梳理

超100篇!CVPR 2020最全GAN论文梳理

拆解组新的GAN:解耦表征MixNMatch

StarGAN第2版:多域多样性图像生成

附下载 | 《可解释的机器学习》中文版

附下载 |《TensorFlow 2.0 深度学习算法实战》

附下载 |《计算机视觉中的数学方法》分享

《基于深度学习的表面缺陷检测方法综述》

《零样本图像分类综述: 十年进展》

《基于深度神经网络的少样本学习综述》

《礼记·学记》有云:独学而无友,则孤陋而寡闻

欢迎加入 GAN/扩散模型 —交流微信群 !

扫描下面二维码,添加运营小妹好友,拉你进群。发送申请时,请备注,格式为:研究方向+地区+学校/公司+姓名。如 扩散模型+北京+北航+吴彦祖

53b89510cddf0899427af6f4e6b6bb08.jpeg

请备注格式:研究方向+地区+学校/公司+姓名

f95e11dbdd3f5431cd6929b52d3ae7ec.jpeg

点击 一顿午饭外卖,成为CV视觉的前沿弄潮儿!,领取优惠券,加入 AI生成创作与计算机视觉 知识星球!

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值