视觉生产技术
这是2020.8.24开始的视觉AI训练营第一天的打卡内容,这篇学习笔记是对视频内容的复制。通过今天的学习,我重新认识了AI在图像领域(或者说视觉领域)的应用。之前的我只是学习深度学习,包括图像识别等。现在我了解了如何将AI应用到生成图像中去。
一、定义和分类
定义:通过一个/一系列视觉过程,产出新的视觉表达
- 产出:人或机器能够感知的图像视频,而不是标签或特征
- 要求:新的,和输入不一样
- 用AI实现传统上设计师通过PS, MAYA等的工作
分类: - 生成:从0到1
- 拓展:从1到N
- 摘要:从N到1,浓缩出主要信息
- 升维:从An到An+1,例如2D→3D
- 增强/变换:从A到B
- 插入/合成:A+B=C
- 擦除:A-B=C
二、通用基础框架
- 请求:输入参数、素材、草案、成品(能不能做一个差不多的?)、案例
-
分发:生产类型
- 通用生成:参数+素材
- 素材合成:参数+素材
- 照图生图:参数+素材+成品
- 视频摘要:参数+素材+成品