我迟早被这些AI绘画笑死...

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>CV微信技术交流群

詹士 发自 凹非寺
转载自:量子位(QbitAI)

AI绘画,你没事吧?

狗主人直接变身狗爸爸,被顶上APP首页:

fd66a9087f7b566a6b7160df2aa85a1a.png

纯欲风女孩变成了纯欲风猴子……

下方网友评价「当真是二次猿模型」:

3f8981f62f401a7b3b1c78f1471c9e6b.png

甚至,还有结婚照男主角变成墙上大头贴,配着粉色花瓣,画风十分阴间……

c20d7ff0ccf021aef9b8d6bc77d20863.png

这些例子来自各平台用户们的分享,这两天,又掀起一波「AI绘画离谱作品」的讨论。

抖音热榜上,该话题流量超660万,阿根廷足球队也甘拜下风。

c9c30e1f8d1be198253e89a4cc9c36d6.png

连无穷小亮也在网上吐槽「AI智障绘画」,引来大批围观:

b4081cb693cb266cf8c2025f40de443a.png

离谱的AI绘画背后,是时下AIGC门槛一再降低,近期迎来一阵集中爆发。

抖音、腾讯、美图等厂牌纷纷推出自家小程序,中文界面,在线可玩,点点选选即可生成。

大批量参与下,五光十色姹紫嫣红的离谱作品,它就来了。

5ce56dd4998a42508642b01503b55458.png

没有最离谱,只有更离谱

前面几个案例仅是冰山一角,各种离大谱AI绘画已成为互联网段子源泉。

这其中,最离谱的莫过「大变活人」型魔改,直接把当事人给整没了

有少女化身抽象风建筑穹顶:

8e03db3b5a646d57f79190a26824e739.png

有情侣合体,变成一只五彩斑斓的老虎:

56a23bc4694396e67494607a5201054c.png

还有帽衫小哥幻化小区木质走廊,也不知要不要算入公摊:

24e54dbe2828ca21d6610992541eb8cb.png

伤害性更强的是,AI能错到人畜互换的地步。

「我与女友」,在AI眼里是「我与猎狗」:

d126f4ae3015cf8af7ec3679000f8ecd.png

萌妹与小狗,变成了小狗与萌妹…….

d8391eeb50f2c612eb4b63663910e12b.png

除却「魔改活人」,AI还不管三七二十一,将所有图片都二次元化

比如,爱情变兄弟情,200斤哥哥招呼160斤弟弟品品自己的肚腩:

89d1a14ce3cdc908c7e9fb0017dd65ec.png

比如,将万物娘化,白T小哥也被变身二次元小姐姐,多出来一条腿不知如何安放…….

80678973366a1a8e8fa0863b3ed095b1.png

身材性感化也是倾向之一,明明是少女与金毛,变成——秀霸腿的肌肉壮汉。

b2ffb3ea71552bbeed7abdfbab2725a0.png

由于画风实在离谱,已有网友开搞「绝对猜不到原图」活动。

AI认为你在巴黎郊外凡尔赛:

a5921d2ba2a04f3cd221bc6918d07b24.png

现实中,不过是站在雍和宫门外:

a04651705d89d64dde70d5cf15ba3c1c.png

AI以为是怪叔叔在偷海报?

559d4f1b5adf99fa41d52136d453144c.png

现实里,明明是酷酷女孩随手一个Pose的街拍照:

cfaaecd508b21156838aeb97dd61286b.png

本以为是二次元森林公主:

804d2e213bf03d54e7c4ec96533ac649.png

其实是阿姨手里的婴儿。(人家真的还是宝宝啊,这样好么???)

42a684e3e5a83589949ec5266e6c631a.png

种种离谱图画或荒诞、或魔幻,对当事人,无疑是一场生活意外。

初次上手AI的萌新们满怀期待,本以为搭上了前沿技术快船,只是没想到技术直接越过人类常识,给刚见面的网友们一通电子毒打。

AI绘画是怎么变离谱的?

为什么AI绘画会产生如此离谱的案例?这要从AI生成步骤展开一二。

图片生成模型一般由两部分组成,一部分用于文本到图像理解,将文本与图像做关联,另一部分为图像生成。

以近年最火的Stable Diffusion为例,该模型就包括CLIP文本-图像的多模态部分、生成图像的Diffusion部分。

38c1ea1aabb6acedf381e387865e29a8.png

 图源:Paul Mooney

AI生成图片离谱,一方面,问题出在文本-图像部分

即:训练过程中,模型内将一些本来无关的特征做了不当地、单一化地关联。

有网友反映意间的AI画red bodysuit,AI只会一个劲画EVA中的明日香,就可能是将「red bodysuit」关键词与明日香进行了直接关联。

另一种可能性是训练后的模型也可能忽略一些关键特征,导致对人像识别有误。很多人像最终变成动物甚至建筑物,可能与此有关。

但上面解释还不是全部,问题也可能与生成部分有关。

由于动漫风格绘图模型的训练集本身有倾向性,也可能导致生成过程中,最终结果带着「男男向腐文化」、「身材性感化肌肉化」、「人像萌化娘化物化」、「物体拟人化」等等特征。

5e9449d2101392847870bfe1f3ffd005.png

上述问题一直存在。

前段时间大火的NovelAI,就因生成的二次元妹子常有三条腿而遭吐槽,甚至有网友靠此种细节来分辨是否AI生成的作品。

与之类似,动漫风AI长时间都处理不好「吃面条」问题,生成图中,筷子、头发、面条、手指常被混淆:

34f54a52d17cc561c5784af2b96658b9.png
这还不算最离谱的 图源:@ShiShizUta

此类问题,即便头部AI模型也无法完全解决。

就在今年10月,科技博主Andy Baio就在社交媒体上po出一系列Stable Diffusion生成的奇葩图片。

这当中,有手指乱套的:

8dbf8aefd10f03339d71b6880edb0a07.png

动物特征不符合常理的:

5d13b65433c09af4f24a1f4540c3d55e.png

更多图片,这里就不放了,着实过于鬼畜,甚至有点吓人

不过技术从业者一直在着手解决种种离谱情况。

最近新发布的一个动漫图片生成AI,Niji·journey,主打宣传点之一,就是「能让二次元妹子正常吃面」

8f8bb5a5b3b7e206fc6fd926ae06bd13.png

One More Thing

最后,介绍一下最近带火AI绘画的各家工具

前文案例大部分来自抖音AI绘画特效以及一个名为意间AI绘画的微信小程序,这俩也是此番引发海量关注的爆破手。

意间AI绘画通过微信小程序即可进入,免费注册可用。

使用方法上,支持上传图片,输入关键字,配合引导力度及几个简单设置即可生成作品。

据其官方宣称,上线刚2个月,用户增长达100万。但如上面所见,对其吐槽声音也不少,也有网友在线分享关键词技巧。

acb31569279940c91909a5874b27891b.png

相比前者,抖音的工具更为简单

通过抖音APP搜索「AI绘画」可进入特效,再选中照片,不必设置提示词等参数,直接就能自动生成动漫风、油画风等作品。

当然,最终结果也更不可控,冷不丁就是一个意外:

42e3775b0b8ecac181477ce8dfe268f2.gif
 来源:小柔SeeU

除前面两个工具,美图秀秀和QQ也在上周末前后脚推出旗下AI绘画工具。

美图秀秀通过首页菜单进入AI绘画,同样无需关键词,导入照片即可生成。

0f5e7a06040c63754b9c386b6130f3f2.png

至于生成效果,所得图片同本人面部特征关联不算高,相比其他动漫风格滤镜差异不大

a95794e407f5c6bcb8e7f515a52e59f6.png

 图源:美图秀秀 官方微博

相比前者,QQ的AI绘画进入更复杂

需要先进入其社交产品「小世界」,再在创作素材库中,通过「异次元的我」栏目进入。

同抖音、美图一样,QQ所提供的AI也无需输入关键词和任何参数,上传照片即可生成一段「变身」短视频。其最终效果也跟美图差不多。

aa141603218df6ac61d0d5f4670b0d3a.png

总的来说,此番几个AI工具中,意间的AI绘画可玩性更高,产生的离谱结果也更五花八门,其他几家大厂平台,抖音更为出圈,生成结果同样更多样。

可以预见的是,伴随AIGC大火,AI绘图飞入寻常百姓家,当中离谱段子笑料涌现还会更多。

最后问问:

你认为AI生成离谱图片这件事,有哪些办法能避免?

 
 

点击进入—>CV微信技术交流群

CVPR/ECCV 2022论文和代码下载

 
 

后台回复:CVPR2022,即可下载CVPR 2022论文和代码开源的论文合集

后台回复:ECCV2022,即可下载ECCV 2022论文和代码开源的论文合集

后台回复:Transformer综述,即可下载最新的3篇Transformer综述PDF

目标检测和Transformer交流群成立
扫描下方二维码,或者添加微信:CVer222,即可添加CVer小助手微信,便可申请加入CVer-目标检测或者Transformer 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。
一定要备注:研究方向+地点+学校/公司+昵称(如目标检测或者Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群

▲扫码或加微信号: CVer222,进交流群
CVer学术交流群(知识星球)来了!想要了解最新最快最好的CV/DL/ML论文速递、优质开源项目、学习教程和实战训练等资料,欢迎扫描下方二维码,加入CVer学术交流群,已汇集数千人!

▲扫码进群
▲点击上方卡片,关注CVer公众号
整理不易,请点赞和在看
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值