深度学习采集数据注意事项

本文强调了在实际项目中创建有效AI训练数据的重要性,包括与预期场景一致的数据收集、全面覆盖各种变化、保证清晰度、适当比例的正负样本、均衡类别分布和精准标注。数据集规模越大越好,以支持模型的准确性和鲁棒性。
摘要由CSDN通过智能技术生成

1、实际落地项目应该与现实应用中预期场景相似甚至完全相同的条件下获取数据,只有出于办公室以实验测试为目的时,才可以在办公室场景下获取数据;

2、训练数据必须涵盖实际应用过程中可能发生的所有变化,从不同的背景中拍摄不同角度,如物体本身侧面多角度、相对大小、旋转角度、倾斜、放倒、平铺等,其中也包括一般条件的变化,如环境本身正常水平的光线情况、黑暗场景下、补光过亮的场景下等;

3、保证采集的数据的质量,画面清晰最好,起码不模糊,大小最好和使用场景的尺寸接近;

4、目标物可以有部分遮挡,但是必须可辨识;

5、数据集中既要包括想要检测的物体,也要包括不想检测的物体;

6、类别种类不是很多时,采集的图像中不能够每张图像都存在该目标物;

7、正负样本比例应该为100 :5,当物体种类少的情况下,应该增加负样本数量,比例可根据实际情况做出相应的调整;

8、如果是多个类别,那么每个目标在数据集中出现的次数应该差不多;

9、目标所被标注部分是按照你希望如何被检测到的方式取标注(如只检测一半、可重叠区域);

10、按照以上标准数据集整体数量越多越好。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值