我迟早被这些AI绘画笑死...-CSDN博客

点击下方卡片，关注“CVer”公众号

AI/CV重磅干货，第一时间送达

点击进入—>CV微信技术交流群

詹士发自凹非寺
转载自：量子位（QbitAI）

AI绘画，你没事吧？

狗主人直接变身狗爸爸，被顶上APP首页：

纯欲风女孩变成了纯欲风猴子……

下方网友评价「当真是二次猿模型」：

甚至，还有结婚照男主角变成墙上大头贴，配着粉色花瓣，画风十分阴间……

这些例子来自各平台用户们的分享，这两天，又掀起一波「AI绘画离谱作品」的讨论。

抖音热榜上，该话题流量超660万，阿根廷足球队也甘拜下风。

连无穷小亮也在网上吐槽「AI智障绘画」，引来大批围观：

离谱的AI绘画背后，是时下AIGC门槛一再降低，近期迎来一阵集中爆发。

抖音、腾讯、美图等厂牌纷纷推出自家小程序，中文界面，在线可玩，点点选选即可生成。

大批量参与下，五光十色姹紫嫣红的离谱作品，它就来了。

没有最离谱，只有更离谱

前面几个案例仅是冰山一角，各种离大谱AI绘画已成为互联网段子源泉。

这其中，最离谱的莫过「大变活人」型魔改，直接把当事人给整没了。

有少女化身抽象风建筑穹顶：

有情侣合体，变成一只五彩斑斓的老虎：

还有帽衫小哥幻化小区木质走廊，也不知要不要算入公摊：

伤害性更强的是，AI能错到人畜互换的地步。

「我与女友」，在AI眼里是「我与猎狗」：

萌妹与小狗，变成了小狗与萌妹…….

除却「魔改活人」，AI还不管三七二十一，将所有图片都二次元化。

比如，爱情变兄弟情，200斤哥哥招呼160斤弟弟品品自己的肚腩：

比如，将万物娘化，白T小哥也被变身二次元小姐姐，多出来一条腿不知如何安放…….

身材性感化也是倾向之一，明明是少女与金毛，变成——秀霸腿的肌肉壮汉。

由于画风实在离谱，已有网友开搞「绝对猜不到原图」活动。

AI认为你在巴黎郊外凡尔赛：

现实中，不过是站在雍和宫门外：

AI以为是怪叔叔在偷海报？

现实里，明明是酷酷女孩随手一个Pose的街拍照：

本以为是二次元森林公主：

其实是阿姨手里的婴儿。（人家真的还是宝宝啊，这样好么？？？）

种种离谱图画或荒诞、或魔幻，对当事人，无疑是一场生活意外。

初次上手AI的萌新们满怀期待，本以为搭上了前沿技术快船，只是没想到技术直接越过人类常识，给刚见面的网友们一通电子毒打。

AI绘画是怎么变离谱的？

为什么AI绘画会产生如此离谱的案例？这要从AI生成步骤展开一二。

图片生成模型一般由两部分组成，一部分用于文本到图像理解，将文本与图像做关联，另一部分为图像生成。

以近年最火的Stable Diffusion为例，该模型就包括CLIP文本-图像的多模态部分、生成图像的Diffusion部分。

△ 图源：Paul Mooney

AI生成图片离谱，一方面，问题出在文本-图像部分。

即：训练过程中，模型内将一些本来无关的特征做了不当地、单一化地关联。

有网友反映意间的AI画red bodysuit，AI只会一个劲画EVA中的明日香，就可能是将「red bodysuit」关键词与明日香进行了直接关联。

另一种可能性是训练后的模型也可能忽略一些关键特征，导致对人像识别有误。很多人像最终变成动物甚至建筑物，可能与此有关。

但上面解释还不是全部，问题也可能与生成部分有关。

由于动漫风格绘图模型的训练集本身有倾向性，也可能导致生成过程中，最终结果带着「男男向腐文化」、「身材性感化肌肉化」、「人像萌化娘化物化」、「物体拟人化」等等特征。

上述问题一直存在。

前段时间大火的NovelAI，就因生成的二次元妹子常有三条腿而遭吐槽，甚至有网友靠此种细节来分辨是否AI生成的作品。

与之类似，动漫风AI长时间都处理不好「吃面条」问题，生成图中，筷子、头发、面条、手指常被混淆：

△这还不算最离谱的图源：@ShiShizUta

此类问题，即便头部AI模型也无法完全解决。

就在今年10月，科技博主Andy Baio就在社交媒体上po出一系列Stable Diffusion生成的奇葩图片。

这当中，有手指乱套的：

动物特征不符合常理的：

更多图片，这里就不放了，着实过于鬼畜，甚至有点吓人。

不过技术从业者一直在着手解决种种离谱情况。

最近新发布的一个动漫图片生成AI，Niji·journey，主打宣传点之一，就是「能让二次元妹子正常吃面」。

One More Thing

最后，介绍一下最近带火AI绘画的各家工具。

前文案例大部分来自抖音AI绘画特效以及一个名为意间AI绘画的微信小程序，这俩也是此番引发海量关注的爆破手。

意间AI绘画通过微信小程序即可进入，免费注册可用。

使用方法上，支持上传图片，输入关键字，配合引导力度及几个简单设置即可生成作品。

据其官方宣称，上线刚2个月，用户增长达100万。但如上面所见，对其吐槽声音也不少，也有网友在线分享关键词技巧。

相比前者，抖音的工具更为简单。

通过抖音APP搜索「AI绘画」可进入特效，再选中照片，不必设置提示词等参数，直接就能自动生成动漫风、油画风等作品。

当然，最终结果也更不可控，冷不丁就是一个意外：

△ 来源：小柔SeeU

除前面两个工具，美图秀秀和QQ也在上周末前后脚推出旗下AI绘画工具。

美图秀秀通过首页菜单进入AI绘画，同样无需关键词，导入照片即可生成。

至于生成效果，所得图片同本人面部特征关联不算高，相比其他动漫风格滤镜差异不大。

△ 图源：美图秀秀官方微博

相比前者，QQ的AI绘画进入更复杂。

需要先进入其社交产品「小世界」，再在创作素材库中，通过「异次元的我」栏目进入。

同抖音、美图一样，QQ所提供的AI也无需输入关键词和任何参数，上传照片即可生成一段「变身」短视频。其最终效果也跟美图差不多。

总的来说，此番几个AI工具中，意间的AI绘画可玩性更高，产生的离谱结果也更五花八门，其他几家大厂平台，抖音更为出圈，生成结果同样更多样。

可以预见的是，伴随AIGC大火，AI绘图飞入寻常百姓家，当中离谱段子笑料涌现还会更多。

最后问问：

你认为AI生成离谱图片这件事，有哪些办法能避免？

点击进入—>CV微信技术交流群

CVPR/ECCV 2022论文和代码下载

后台回复：CVPR2022，即可下载CVPR 2022论文和代码开源的论文合集

后台回复：ECCV2022，即可下载ECCV 2022论文和代码开源的论文合集

后台回复：Transformer综述，即可下载最新的3篇Transformer综述PDF

目标检测和Transformer交流群成立
扫描下方二维码，或者添加微信：CVer222，即可添加CVer小助手微信，便可申请加入CVer-目标检测或者Transformer 微信交流群。另外其他垂直方向已涵盖：目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。
一定要备注：研究方向+地点+学校/公司+昵称（如目标检测或者Transformer+上海+上交+卡卡），根据格式备注，可更快被通过且邀请进群

▲扫码或加微信号: CVer222，进交流群
CVer学术交流群（知识星球）来了！想要了解最新最快最好的CV/DL/ML论文速递、优质开源项目、学习教程和实战训练等资料，欢迎扫描下方二维码，加入CVer学术交流群，已汇集数千人！

▲扫码进群
▲点击上方卡片，关注CVer公众号