扩散模型 | 矢量艺术图形生成

点击上方“摸鱼吧算法工程师”卡片,关注星标

获取有趣、好玩的前沿干货!

https://arxiv.org/pdf/2211.11319.pdf

VectorFusion: Text-to-SVG by Abstracting Pixel-Based Diffusion Models

扩散模型在文本到图像合成中显示出令人印象深刻的结果。使用大量带文本描述的图像数据集,扩散模型学习生成高度多样化的对象和场景的光栅图像。但是,设计人员经常使用图像的矢量表示形式,例如用于数字图标或艺术的矢量图形 (SVG)。矢量图形可以缩放到任意大小,并且紧凑。

本文展示了在图像像素表示上训练的文本条件扩散模型可用于生成 SVG 矢量图形。并且,是在没有使用文字描述的 SVG 的大型数据集的情况下做到的。通过优化可微矢量图形光栅化器,方法 VectorFusion 从预训练的扩散模型中提取抽象语义知识。受最近文本到 3D 工作的启发,还使用分数蒸馏采样学习了与文本描述一致的 SVG。为了加速生成并提高保真度,VectorFusion 还从图像样本进行初始化。

实验显示比以前的工作质量更高,并展示了一系列风格,包括像素艺术和草图。

https://ajayj.com/vectorfusion

5be47454fdd81f7dfbd9e1e0a6f20270.png

ab266a8e5917626d1ec12ad66485a150.png

81d16f100007de19f113411deb15a652.png

90c60f7ccde2e5cdfe9cc787653d0b8f.png

-------------END-------------

往期阅读

AVFR-GAN:音视觉的人脸驱动技术

计算机视觉中的传统特征提取方法总结

CVPR 2022|精准高效估计多人3D姿态,美图&北航联合提出分布感知式单阶段模型

CVPR22 Oral|MLP进军底层视觉!谷歌提出MAXIM模型刷榜多个图像处理任务,代码已开源

CVPR 2022 | 针对目标检测的重点与全局知识蒸馏(FGD)

Sampling-Argmax:用重参数技巧优化Soft-Argmax

实践教程|对稀有飞机数据集进行多属性物体检测:使用YOLOv5的实验过程

712973f6d3f96475f72ca93cd87a627d.png

如果觉得有用,就点个“在看”吧 06a57fe8a6add4736276761f43ad15d1.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值