安装配置环境
!pip install numpy pandas matplotlib requests tqdm opencv-python
数据集制作注意事项
删除无关图片
类别均衡
多样性、代表性、一致性
数据集应尽可能包括目标物体的各类场景,训练出的图像分类模型才能在各类测试场景中具备好的泛化性能,防止过拟合。
不同尺寸、比例的图像
不同拍摄环境(光照、设备、拍摄角度、遮挡、远近、大小)
不同形态(完整西瓜、切瓣西瓜、切块西瓜)
不同部位(全瓜、瓜皮、瓜瓤、瓜子)
不同时期(瓜秧、小瓜、大瓜)
不同背景(人物、菜地、抠图)
不同图像域(照片、漫画、剪贴画、油画)