交叉验证python代码_python – 如何正确交叉验证

我一直在尝试使用

Python和scikit-learn工具包训练ML分类器.

首先,我在分割数据集时应用了自己的阈值(例如int(len(X)* 0.75)),并在打印指标时得到了这个结果:

precision recall f1-score support

1 0.63 0.96 0.76 23

2 0.96 0.64 0.77 36

avg / total 0.83 0.76 0.76 59

然后我使用交叉验证,以便使用以下方法更精确地查看模型的准确性:scores = cross_validation.cross_val_score(X,y,cv = 10)并获得以下分数:

Cross_val_scores = [0.66666667 0.79166667 0.45833333 0.70833333 0.52173913

0.52173913 0.47826087 0.47826087 0.52173913 0.47826087]

准确度:0.56(标准偏差:/ – 0.22),其中精度等于平均值​​(分数).

有人可以建议我如何正确解释这些分数?我理解在使用交叉验证时如何分割数据集以便在整个数据集范围内观察模型的准确性,但我想知道更多.

>例如,是否有一种方法可以分割它并获得尽可能高的准确度(例如0.79166667),如果是这样我怎么能这样做?

>我想这是因为我的数据集中存在一个分裂,即使用这些数据训练的模型可以产生更接近的预测,对吗?

>有没有办法减少相对较高的标准偏差?

感谢您的时间.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值