基于大模型的标注图像数据集生成：DatasetDM: Synthesizing Data with Perception Annotations Using Diffusion Models

学术菜鸟小晨

已于 2023-09-15 16:31:43 修改

阅读量469

点赞数

文章标签： chatgpt 感知算法机器学习人工智能

于 2023-09-14 15:08:28 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34717531/article/details/132876669

版权

论文作者：Weijia Wu,Yuzhong Zhao,Hao Chen,Yuchao Gu,Rui Zhao,Yefei He,Hong Zhou,Mike Zheng Shou,Chunhua Shen

作者单位：Zhejiang University; University of Chinese Academy of Sciences; National University of Singapore

论文链接：https://arxiv.org/pdf/2308.06160v1.pdf

项目链接：https://github.com/showlab/DatasetDM
https://weijiawu.github.io/Data

内容简介：

1）方向：基于生成模型的数据集生成

2）应用：数据集生成

3）背景：目前深度网络对大规模数据的需求较高，但采集和标注这些数据通常耗时。相比之下，使用生成模型（如DALL-E和扩散模型）可以生成无限数量的合成数据。

4）方法：本文提出了DatasetDM，一种通用的数据集生成模型，可以生成多样的合成图像以及相应的高质量感知标注。所提出方法基于预训练的扩散模型，将文本引导的图像合成扩展到感知数据生成。扩散模型的潜在代码可以通过解码器模块有效地解码为准确的感知标注。解码器只需使用少于1%（约100张图像）的手动标记图像进行训练，从而实现了无限大的带标注数据集的生成。随后，这些合成数据可用于训练各种感知模型以用于下游任务。

5）结果：通过所提出方法生成的数据集在各种下游任务中展示了强大的性能，包括语义分割、实例分割和深度估计。尤其值得注意的是，它在语义分割和实例分割方面取得了最先进的结果，并且在域泛化方面比仅使用真实数据更加稳健；在零样本分割设置中实现了最先进的结果；同时具备高效应用和新任务组合（例如图像编辑）的灵活性。

GPT-4与扩散模型协同，生成的数据示例：

新数据集加持，感知算法性能提升显著：

学术菜鸟小晨

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
基于大模型的标注图像数据集生成：DatasetDM: Synthesizing Data with Perception Annotations Using Diffusion Models

4）方法：本文提出了DatasetDM，一种通用的数据集生成模型，可以生成多样的合成图像以及相应的高质量感知标注。所提出方法基于预训练的扩散模型，将文本引导的图像合成扩展到感知数据生成。解码器只需使用少于1%（约100张图像）的手动标记图像进行训练，从而实现了无限大的带标注数据集的生成。5）结果：通过所提出方法生成的数据集在各种下游任务中展示了强大的性能，包括语义分割、实例分割和深度估计。相比之下，使用生成模型（如DALL-E和扩散模型）可以生成无限数量的合成数据。1）方向：基于生成模型的数据集生成。
复制链接

扫一扫

学术菜鸟小晨

CSDN认证博客专家 CSDN认证企业博客

码龄8年

人工智能领域新星创作者

217: 原创

1860: 周排名

6168: 总排名

42万+: 访问

: 等级

4236: 积分

1万+: 粉丝

745: 获赞

380: 评论

3128: 收藏

私信

关注

热门文章

分类专栏

最新评论

yolov8实战第六天——yolov8 TensorRT C++ 部署——（踩坑，平坑，保姆教程）
qq_54084408: 我又试了试YOLOv8s，但是在取消注释运行的时候报了下面这种错误： [code=cpp] OpenCV(4.8.0) Error: Assertion failed (size.width>0 && size.height>0) in cv::imshow, file C:\GHA-OCV-1\_work\ci-gha-workflow\ci-gha-workflow\opencv\modules\highgui\src\window.cpp, line 971 [/code] 请问我应该如何解决呀？
yolov8实战第六天——yolov8 TensorRT C++ 部署——（踩坑，平坑，保姆教程）
qq_54084408: 请问这种报错我应该如何解决？您有遇到过吗？
yolov8实战第六天——yolov8 TensorRT C++ 部署——（踩坑，平坑，保姆教程）
qq_54084408: Loading weights: ../weights/yolov8x.wts The implicit batch dimension mode has been deprecated. Please create the network with NetworkDefinitionCreationFlag::kEXPLICIT_BATCH flag whenever possible. 3: (Unnamed Layer* 0) [Convolution]:kernel weights has count 2160 but 864 was expected 4: (Unnamed Layer* 0) [Convolution]: count of 2160 weights in kernel, but kernel dimensions (3,3) with 3 input channels, 32 output channels and 1 groups were specified. Expected Weights count is 3 * 3*3 * 32 / 1 = 864 4: [convolutionNode.cpp::nvinfer1::builder::ConvolutionNode::computeOutputExtents::58] Error Code 4: Internal Error ((Unnamed Layer* 0) [Convolution]: number of kernel weights does not match tensor dimensions) 3: [network.cpp::nvinfer1::Network::addResize::1421] Error Code 3: API Usage Error (Parameter check failed at: network.cpp::nvinfer1::Network::addResize::1421, condition: input.getDimensions().nbDims > 0 ) Assertion failed: upsample10, file D:\ZMX\yolov8_tensorrt-main\src\model.cpp, line
yolov8实战第六天——yolov8 TensorRT C++ 部署——（踩坑，平坑，保姆教程）
qq_54084408: 请问如果我用的是yolov8x模型，相应的需要在哪里修改呀？就差最后一步了
yolov8实战第三天——yolov8TensorRT部署（python推理）（保姆教学）
丶皓月当空: 怎么看速度啊？

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

学术菜鸟小晨 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。