深度学习采集数据注意事项

最新推荐文章于 2024-07-09 20:01:23 发布

JYD_0307

最新推荐文章于 2024-07-09 20:01:23 发布

阅读量950

点赞数

文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/JYD_0307/article/details/134056330

版权

本文强调了在实际项目中创建有效AI训练数据的重要性，包括与预期场景一致的数据收集、全面覆盖各种变化、保证清晰度、适当比例的正负样本、均衡类别分布和精准标注。数据集规模越大越好，以支持模型的准确性和鲁棒性。

摘要由CSDN通过智能技术生成

1、实际落地项目应该与现实应用中预期场景相似甚至完全相同的条件下获取数据，只有出于办公室以实验测试为目的时，才可以在办公室场景下获取数据；

2、训练数据必须涵盖实际应用过程中可能发生的所有变化，从不同的背景中拍摄不同角度，如物体本身侧面多角度、相对大小、旋转角度、倾斜、放倒、平铺等，其中也包括一般条件的变化，如环境本身正常水平的光线情况、黑暗场景下、补光过亮的场景下等；

3、保证采集的数据的质量，画面清晰最好，起码不模糊，大小最好和使用场景的尺寸接近；

4、目标物可以有部分遮挡，但是必须可辨识；

5、数据集中既要包括想要检测的物体，也要包括不想检测的物体；

6、类别种类不是很多时，采集的图像中不能够每张图像都存在该目标物；

7、正负样本比例应该为100 ：5，当物体种类少的情况下，应该增加负样本数量，比例可根据实际情况做出相应的调整；

8、如果是多个类别，那么每个目标在数据集中出现的次数应该差不多；

9、目标所被标注部分是按照你希望如何被检测到的方式取标注（如只检测一半、可重叠区域）；

10、按照以上标准数据集整体数量越多越好。

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
深度学习采集数据注意事项

2、训练数据必须涵盖实际应用过程中可能发生的所有变化，从不同的背景中拍摄不同角度，如物体本身侧面多角度、相对大小、旋转角度、倾斜、放倒、平铺等，其中也包括一般条件的变化，如环境本身正常水平的光线情况、黑暗场景下、补光过亮的场景下等；7、正负样本比例应该为100 ：5，当物体种类少的情况下，应该增加负样本数量，比例可根据实际情况做出相应的调整；3、保证采集的数据的质量，画面清晰最好，起码不模糊，大小最好和使用场景的尺寸接近；5、数据集中既要包括想要检测的物体，也要包括不想检测的物体；
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。