用大白话盘点AIGC文生图中的常见模型与技术概念

最新推荐文章于 2024-09-12 19:15:58 发布

u013250861

最新推荐文章于 2024-09-12 19:15:58 发布

阅读量163

点赞数

分类专栏： VLM/多模态文章标签： AIGC 机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013250861/article/details/136575116

版权

VLM/多模态专栏收录该内容

27 篇文章 38 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

本文以大白话介绍AIGC领域的常见模型和技术，包括AE/VAE、GAN、Diffusion模型的基础概念和工作原理，以及CLIP、U-NET、ADD算法的作用。文章旨在为非技术背景的读者提供一个理解当前生成模型趋势和概念的入门指南，虽然牺牲了一些技术细节的准确性，但有助于初学者理解高维和低维数据的关系以及模型生成图片的思路。

摘要由CSDN通过智能技术生成

本文主要面向产品经理或其他非技术专业的人员，讲述其模型的基本概念与实现思路。可以作为了解当前生成模型的趋势和概念的工具，或者提供初步扫盲。对于寻求深入技术细节和如何实现的读者来说，还是建议查看相关的研究论文或文章。为了内容更加易懂，本文会牺牲一些技术细节的准确性，个人水平所限，如果有逻辑或技术原理上的错误，欢迎大佬指出（鞠躬）。

本文不会出现公式，对理解背景没有要求。如果你看过《三体》，那么恭喜你可以更好的理解高维和低维。

一、基础模型

如果我们成为了研究人员，想要实现一个机器自动生图模型，那我们需要解决四个问题：

第一个问题是：图片从哪里生成？
AE/VAE模型的答案是：图片由图片生成。
GAN、Diffsion模型的答案是：图片由噪声生成。
（CLIP在场外扯着嗓子大喊：考场内的哥哥们快选我！1+1>2，让你享受文字生图的快乐！）

第二个问题是：图片怎么生成？
AE/VAE模型的答案是：让机器学会图片的特征，就可以从特征里拼凑出一张图片。
GAN模型的答案是：随便你怎么

了解本专栏

超级会员免费看

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
用大白话盘点AIGC文生图中的常见模型与技术概念

本文主要面向产品经理或其他非技术专业的人员，讲述其模型的基本概念与实现思路。可以作为了解当前生成模型的趋势和概念的工具，或者提供初步扫盲。对于寻求深入技术细节和如何实现的读者来说，还是建议查看相关的研究论文或文章。为了内容更加易懂，本文会牺牲一些技术细节的准确性，个人水平所限，如果有逻辑或技术原理上的错误，欢迎大佬指出（鞠躬）。本文不会出现公式，对理解背景没有要求。如果你看过《三体》，那么恭喜你可以更好的理解高维和低维。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。