Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task02笔记

小白记录Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task02的学习

背景知识

AIGC(AI-Generated Content)是通过人工智能技术自动生成内容的生产方式,很早就有专家指出,AIGC将是未来人工智能的重点方向,也将改造相关行业和领域生产内容的方式。

AI生图则是其中最早被我们大众所熟知并广泛尝试的AIGC领域。

对所有人来说,定期关注AI生图的最新能力情况都十分重要:

对于普通人来说,可以避免被常见的AI生图场景欺骗,偶尔也可以通过相关工具绘图,轻松省力的完成一些简单的初步创作。

对于创作者来说,通过AI生图的工具可以提效,快速制作自己所需要的内容;也可以从中相互学习,通过AI发现自己的弱点以及想办法修复AI目前薄弱的一些问题,最典型的就是AI画的手。

对于技术人来说,了解AI生图的能力的玩法,可以更好地针对自己的业务进行开发和使用,甚至攻克难题开发更实用的工具。

从工具视角回顾一下AI生图的历史

最早的AI生图可追溯到20世纪70年代,当时由艺术家哈罗德·科恩(Harold Cohen)发明AARON,可通过机械臂输出作画。

现代的AI生图模型大多基于深度神经网络基础上训练,最早可追溯到2012年吴恩达训练出的能生成“猫脸”的模型。

它使用卷积神经网络(CNN)训练,证明了深度学习模型能够学习到图像的复杂特征。

2015年,谷歌推出了“深梦”(Deep Dream)图像生成工具,类似一个高级滤镜,可以基于给定的图片生成梦幻版图片——

2021 年 1 月 OpenAI 推出DALL-E模型(一个深度学习算法模型,是GPT-3 语言处理模型的一个衍生版本),能直接从文本提示“按需创造”风格多样的图形设计——

在当时,就已经被一些媒体评价为:“ 秒杀50%的设计行业打工人应该是没有问题的,而且是质量和速度双重意义上的“秒杀” ”。

一般来说,AI生图模型属于多模态机器学习模型,通过海量的图库和文本描述的深度神经网络学习,最终的目标是可以根据输入的指示(不管是文本还是图片还是任何)生成符合语义的图片

AI生图的难点和挑战

如上文所说,AI绘图最广为人知,也最令人头疼的问题就是——它总是画不好“手”。

由于每个模型用于训练的数据是有限的且不一定相同的,它们能匹配的描述和特征也是有限的,所以在风格、具体事物上,不同的模型会有很大的生成差异,且可能存在诸多与现实不符的情况。

而这些问题,就是业界和科研界持续在想办法解决的问题。

在大部分生图场景下,我们可能经常会觉得图片存在“AI味”,这很长一段时间也是科研界和相关从业人员非常头大的问题。

*AI味:AI生成的图片和实际生活场景/艺术家创作的绘画/摄影/三维作品 相比,存在强烈的违和感,或是细节处理,或是画面逻辑性存在问题,一言就能被看出是“AI出品”

目前大部分的模型,已经具备了去除 “AI味” 的能力,且可能存在容易误导他人的情况,这时候我们想辨别可能需要非常仔细地——

  • 观察图片的细节。仔细检查人物的面部特征,尤其是眼睛和嘴巴

  • 检查光线和阴影。分析图片中的光源是否一致,阴影的方向是否与光源相符,是否存在不自然的光线或阴影

  • 分析像素。放大图片,寻找是否有模糊或像素化的部分。

  • 注意背景。检查背景中是否有不协调的元素,比如物体边缘是否平滑,背景中是否有不自然的重复模式。

而这些细节上的AI特性,也许就是我们在某些特定场景下需要解决的挑战。

通过AI解读代码

小白入门,代码很大一部分都是难以理解的。

这里,就强烈推荐阿里云品牌下的AI——通义千问!!

从今年1月左右就开始使用,跟之前使用的poe不相上下(不过毕竟都是用chatGPT的API)。在内地可以使用,也是完全免费。

不管是在写代码方面,解读代码方面,还是回答一些其他问题方面,他都可以拥有出色的能力,关键在于你会不会使用。关于如何使用,网络上教程也已经很多了,博主在这也就不过多赘述了,直接上图让大家感受下通义千问对代码小白的友好。

在任何解析结果页后面继续追问,通义将会给我们更加细致的问题解释,大家可以举一反三,多操作一下。

最后,博主希望大家养成使用AI的习惯,擅用AI,帮你的工作和学习事半功倍。

  • 14
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值