【标题】扩散模型生成数据对图像识别的影响
1. 总体介绍
发展现状: 扩散模型已经可以生成高质量的样本,之前有人研究过生成数据对cv的作用,但是局限于小领域和小规模。
研究目的: 扩散样本对视觉领域的作用,手工标注的样本昂贵、有隐私和安全风险。
探讨方向: 生成样本对cv有用,具体哪方面有用?实验分为三个部分,zero-shot、few-shot和pretrain
2. zero-shot
研究目的:多大程度上影响 & 如何更好的利用数据
3. few-shot
4. 预训练模型
5. 结论
合成数据可以促进image recognition,合成数据在预训练方面甚至超过imagenet。
局限性: 受限于资源无法计算更大尺寸,和图片大小