用大白话盘点AIGC文生图中的常见模型与技术概念

本文以大白话介绍AIGC领域的常见模型和技术,包括AE/VAE、GAN、Diffusion模型的基础概念和工作原理,以及CLIP、U-NET、ADD算法的作用。文章旨在为非技术背景的读者提供一个理解当前生成模型趋势和概念的入门指南,虽然牺牲了一些技术细节的准确性,但有助于初学者理解高维和低维数据的关系以及模型生成图片的思路。
摘要由CSDN通过智能技术生成

本文主要面向产品经理或其他非技术专业的人员,讲述其模型的基本概念与实现思路。可以作为了解当前生成模型的趋势和概念的工具,或者提供初步扫盲。对于寻求深入技术细节和如何实现的读者来说,还是建议查看相关的研究论文或文章。为了内容更加易懂,本文会牺牲一些技术细节的准确性,个人水平所限,如果有逻辑或技术原理上的错误,欢迎大佬指出(鞠躬)。

本文不会出现公式,对理解背景没有要求。如果你看过《三体》,那么恭喜你可以更好的理解高维和低维。

一、基础模型


如果我们成为了研究人员,想要实现一个机器自动生图模型,那我们需要解决四个问题:


第一个问题是:图片从哪里生成?
AE/VAE模型的答案是:图片由图片生成。
GAN、Diffsion模型的答案是:图片由噪声生成。
(CLIP在场外扯着嗓子大喊:考场内的哥哥们快选我!1+1>2,让你享受文字生图的快乐!)


第二个问题是:图片怎么生成?
AE/VAE模型的答案是:让机器学会图片的特征,就可以从特征里拼凑出一张图片。
GAN模型的答案是:随便你怎么

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值