ICCV 2021 Oral | Transformer再下一城！百度&南大提出神经绘画网络：Paint Transformer

最新推荐文章于 2024-06-08 09:51:40 发布

Amusi（CVer）

最新推荐文章于 2024-06-08 09:51:40 发布

阅读量438

点赞数

文章标签：百度人工智能计算机视觉深度学习机器学习

点击下方卡片，关注“CVer”公众号

AI/CV重磅干货，第一时间送达

杨净发自凹非寺
转载自：量子位（QbitAI）

AI已经能教你画油画了。

随便给一张图，笔画序列秒秒钟呈现。

比如世界名画蒙娜丽莎。

亦或是写实类的小鸟。

还有极具氛围感的河灯。

总之什么风格都可以驾驭。

这项技术在Reddit上21小时内就已经有600+的点赞量。

究竟是如何打造的呢？

用前馈网络预测笔画

神经绘画，就是为给定的图像生成一系列笔画，并使用神经网络进行绘画式的真实再现过程。

研究团队提出了一个基于Transformer的框架，叫做Paint Transformer，用前馈网络来预测笔画的参数。

由于当前没有可用的数据集来训练Paint Transformer，受物体检测启发，研究人员设计了一个自训练Pipeline。

整个模型由两个模块组成：笔画预测器和笔画渲染器。

给定目标图像和中间画布图像，笔画预测器，生成一组参数以确定当前笔画集。

预测器包含了两个用于特征嵌入的CNN网路和一个用于参数预测的Transformer。

随后，笔画渲染器为笔画集汇总的每个笔画，生成笔画图像，并将它们绘制到画，产生结果图像，大小为512*512。

在DETR（用Transformer进行对象检测）的基础上，增加了二进制神经元来预测笔画是否应该被保留。

这样它就可以在没有任何现成的数据集的情况下进行训练，同时还能实现出色的泛化能力。

实验表明，这一方法比以前的方法取得了更好的绘画性能，而且训练和推理成本更低。

百度南大团队打造

这项技术由百度、南京大学、罗格斯大学共同打造。

Paint Transformer: Feed Forward Neural Painting with Stroke Prediction

目前代码已经开源，并在一刻相册App上应用。

论文地址：
https://arxiv.org/abs/2108.03798
GitHub网址：
https://github.com/wzmsltw/PaintTransformer

ICCV和CVPR 2021论文和代码下载

后台回复：CVPR2021，即可下载CVPR 2021论文和代码开源的论文合集

后台回复：ICCV2021，即可下载ICCV 2021论文和代码开源的论文合集

后台回复：Transformer综述，即可下载最新的两篇Transformer综述PDF

重磅！Transformer交流群成立

扫码添加CVer助手，可申请加入CVer-Transformer微信交流群，方向已涵盖：目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch和TensorFlow等群。

一定要备注：研究方向+地点+学校/公司+昵称（如Transformer+上海+上交+卡卡），根据格式备注，可更快被通过且邀请进群

▲长按加小助手微信，进交流群

▲点击上方卡片，关注CVer公众号

整理不易，请点赞和在看

Amusi（CVer）

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
ICCV 2021 Oral | Transformer再下一城！百度&南大提出神经绘画网络：Paint Transformer

点击下方卡片，关注“CVer”公众号AI/CV重磅干货，第一时间送达杨净发自凹非寺转载自：量子位（QbitAI）AI已经能教你画油画了。随便给一张图，笔画序列秒秒钟呈现。比如世界名画蒙...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。