训练集调优时的数据分割小览

knn结束另附:数据分割及训练集调优时的数据分割
测试集应该尽可能与训练集互斥

留出法
自助法
交叉验证法

留一法是留出法中的一种

交叉验证法
KFold和StratifiedKFold
都在,sklearn.model_seletion里

交叉验证实现方法,除了咱们前面讲的GridSearchCV之外,还有KFold, StratifiedKFold

用法:
将训练/测试数据集划分n_splits个互斥子集,每次用其中一个子集当作验证集,剩下的n_splits-1个作为训练集,进行n_splits次训练和测试,得到n_splits个结果
StratifiedKFold的用法和KFold的区别是:SKFold是分层采样,确保训练集,测试集中,各类别样本的比例是和原始数据集中的一致。

KFold不对训练集里的正反例均匀采样
在这里插入图片描述

StratifiedKFold考虑到正反例,分类的占比情况

自助法
在这里插入图片描述

有放回抽样,取极限时,有0.368的概率取不到
因此把这部分数据拿出来做测试集

数据量小,交叉验证法

数据量特别小,留一法

自助法,取其中

这样的测试结果,亦称“包外估计”(out- of-bagestimate)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
对于使用YOLOv5来训练自己的数据集进行分割,你可以按照以下步骤进行操作: 1. 数据准备:收集和标注图像数据集,并将其划分为训练集和验证集。确保每个图像都有相应的标注文件,标注文件应包含目标类别和边界框的位置信息。 2. 配置训练环境:安装YOLOv5并配置相关依赖项。可以在GitHub上的YOLOv5仓库中找到详细的安装和配置说明。 3. 数据转换:将数据集转换为YOLOv5所需的格式。YOLOv5使用的数据格式是类似于COCO格式的标注文件(例如JSON或CSV),可以使用脚本将普通的目标检测标注文件转换为YOLOv5格式。 4. 修改模型配置:根据自己的需求,调整YOLOv5模型的配置文件。可以更改网络结构、调整超参数等。 5. 开始训练:使用转换后的数据集和修改后的模型配置文件,开始训练YOLOv5模型。您可以使用命令行命令或脚本来启动训练过程,并指定训练集、验证集、模型配置等参数。 6. 模型评估:在训练过程中,可以定期评估模型在验证集上的性能。通过计算平均精度(mAP)等指标来评估模型的准确性和性能。 7. 模型调优:根据评估结果,调整模型配置、数据增强等参数,以提高模型的性能。可以尝试不同的学习率、批大小、训练迭代次数等参数。 8. 模型测试:在完成训练后,可以使用训练好的模型对新的图像进行分割预测。可以将模型应用于单张图像或整个图像文件夹,并查看预测结果。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值