前言:CLIP大火的2020年和2021年,引爆了生成式模型的各个领域。今天介绍一项工作,专门用来text-to-vector操作,能够生成不同艺术风格的绘图,不需要任何训练的就能取得非常惊艳的效果,值得深入探讨。
目录
贡献概述
一句话概括方法:预训练的CLIP模型被用作最大化给定描述和生成绘图之间相似性的度量。
CLIPDraw不是逼真的图像,而是旨在合成与提示匹配的简单绘图。因此,CLIPDraw优化了一组矢量笔画而不是像素图像,这是一种使绘图偏向于人类可识别的简单形状的约束。
- 通过调整描述性形容词,如“水彩”或“3D渲染”,CLIPDraw产生大大不同的风格的图纸。
- CLIPDraw通常以创造性的方式匹配描述提示,例如在图像本身中编写提示词,或以多种方式解释含糊的名词。
- 使用低笔画数运行CLIPDraw会导致