AI图像生成工具的使用现状|CSDN CMeet 技术研讨会·杭州站回顾-CSDN博客

本文链接：https://blog.csdn.net/csdndevpress0036/article/details/132495477

随着人工智能技术的快速发展，其在图像生成方面的应用也日益广泛。人工智能可以根据给定的文本、图像或其他信息，自动生成具有高度复杂性和真实感的图像，为各个领域的应用提供了新的可能性。2023年8月6日 CSDN CMeet 技术实践研讨会来到杭州，以“AI+图像生成”为主题，邀请图像生成工具的使用者和图像生成相关技术开发者一同探讨。

当前的AI图像生成器主要基于深度学习技术，特别是卷积神经网络（CNN）和生成对抗网络（GAN）的应用。其中，GAN由两个神经网络组成：一个用于生成图像，另一个用于评估生成的图像是否符合要求。通过在神经网络中进行反复的生成和评估，最终可以生成与真实世界相似的图像。

除了GAN，还有其他一些深度学习模型可以用于图像生成，例如变分自编码器（VAE）和自回归模型（AR模型）。VAE可以通过学习数据分布，生成与真实数据相似的图像；AR模型则可以生成与给定图像相似的后续图像。

可以说图像生成模型方面已经有了非常大的进步，相对应的供给美术使用的应用与工具也应运而生。那么现阶段这些应用工具的使用情况到底如何呢？在使用过程中有哪些问题呢？这些工具真的可以有传闻中的提效表现吗？这次研讨会中，一些来自各家大厂（以游戏行业为主）谈论了一些看法。

如果说最终交付的图片是100分，那么现阶段的大部分AI图片生成工具在不断的生成探索后，能给到的图片大概率在40分~80分之间。美术从业者在得到这些“AI草稿”后，再运用自己的专业能力进行细化其达到交付标准。在此过程中，AI图片生成工具在前期的灵感产出、风格语言等方面确实大大提升了沟通效率。但同时，也面临这一些问题。

“新风格”AI难创作

一位资深美术谈到“使用AI图片生成工具生成图片，就像是拿着飞镖打靶子，用风格更恰当、底层模型技术更好的应用喂图则得到高分图片的概率越大，这种情况就比较依赖应用的风格储备。但作为美术，常常面对的是‘新风格’的业务需求给到，那么这种情况下飞镖偏离靶心的概率就更高，需要花比平常更多的时间探索且得到的图片未必满意。”这个应用问题的背后，实际上是模型训练的一个经典的技术难题。

大模型训练的核心是使用大量的计算资源和数据来训练大型神经网络。这些神经网络通常包含数百万甚至数十亿个参数，需要使用高性能计算机和分布式计算技术来训练。在训练过程中，模型会根据给定的数据集进行反复的迭代和调整，以学习到数据的内在规律和特征。

大模型训练的优点是可以提高模型的复杂性和准确性，使其能够更好地处理复杂的任务和数据。当然基于此，大模型训练也存在一些挑战和问题。大模型训练容易过拟合，即模型在训练数据上表现很好，但在新数据上表现不佳。为了解决这个问题，研究者们通常会采用一些正则化技术来减少过拟合，例如Dropout和权重衰减等。很明显这个技术层面的问题，目前的应用工具并没有很好的解决。

AI难以理解素材细节

“素材识别上存在问题，比如草莓内部的纹理、中国元素的精致头饰等，AI对哪些是这些元素是不清楚的。如果遇到这种情况，我们通常是通过一个训练来去弥补。这个探索的过程对我们创作来说是很浪费时间的，且这个探索流程或者说经验没法复用，当换一个场景时之前的方式又不好用了”，另一位从事美术工作的参会者说。

上述使用情景，是AI在图像生成方面一个突出的局限性。AI图像生成器可能无法理解图像中的语义信息。可能你会问既然输入提示词即可生成想要的图片，那为什么不能从图片得到文字呢？这主要是因为当前的AI图像生成器主要依靠深度学习技术，通过训练大量的图像数据来学习图像的特征和结构。这些图像数据通常只包括像素值和颜色等视觉信息，而不包括与语义信息相关的标签和注释。因此，AI图像生成器虽然可以生成看起来很逼真的图像，但它们无法理解图像中的语义信息，无法把握图像中所包含的更深层次的意义和概念。

另外，人类对图像的理解也涉及到许多高级认知过程，例如感知、记忆、推理、概念抽象等。这些过程是AI系统目前难以模拟和实现的。因此，要让AI图像生成器具备理解语义信息的能力，还需要进一步的研究和技术突破。

不是在学工具，就是在学新工具的路上

相信大家近半年来，从ChatGPT的应用席卷全球开始至今，几乎每个星期都会被各类AI事件轰炸一次。相关领域掀起投资热，更多应用创意获得资本青睐，可以预见到的是未来一到两年，新的应用软件会层出不穷。

设计师群体可能是较早受到AI工具提效“红利”影响的群体之一，早期某几个职业短时间内大幅度的效率提升，短期内不可避免的会影响该职业的就业稳定预期。这使得更多的美术设计开始积极的学习新工具，并尝试将新工具运用到工作中，生怕被新浪潮遗落。这就造成了一个现象：美术们不是在在学工具，就是在学新工具的路上，并且有可能这个状况会在未来的一两年内持续。

对美术团队的管理者而言带来了新问题：平衡全员体验新工具与完成团队任务的矛盾。因为对于美术团队来说，最重要的是完成公司现阶段的任务安排。目前，AI工具对美术工作能有效提效的部分集中在某几个环节，在其他环节上现阶段并没有显著效果。从完成任务的角度考虑，管理者并不希望所有环节上的美术都去研究新工具；但长期看，也许过段时间某个新应用的产生就可以大幅提升某一个“其他环节”的效率，这谁又能说的准？

总结

回看历史，每一次科技革命使得生产效率的提升，都会使大众的生活更好而不会更差，作为普通人我们尽力拥抱并期待。本次技术实践研讨会令工具使用者和相关技术研发有了直接的交流，还讨论了一些关于算力资源损耗带来发展限制、如何利用国内现有技术提供与国外体验上差距更小的应用等问题。参会者收获多多，感兴趣者可关注CSDN CMeet系列活动的后续安排，参与下一次的交流。