sklearn中数据拆分

最新推荐文章于 2024-05-31 17:18:37 发布

陈陈的糖罐子

最新推荐文章于 2024-05-31 17:18:37 发布

阅读量434

点赞数

分类专栏： sklearn 文章标签： sklearn 人工智能 python

本文链接：https://blog.csdn.net/shanshuyue/article/details/121015793

版权

sklearn 专栏收录该内容

15 篇文章 0 订阅

订阅专栏

导入包
在这里插入图片描述
生成数据

train_test_split拆分

kFold拆分

sKFold拆分

小结：

全部代码：

import numpy as np

import pandas as pd

from sklearn.neighbors import KNeighborsClassifier

from sklearn.model_selection import train_test_split

# cv int 6 数据分成6份
from sklearn.model_selection import cross_val_score,GridSearchCV

#KFold,StratifiedKFold将数据分成多少份
from sklearn.model_selection import KFold,StratifiedKFold

data = np.random.randint(0,10,size = (8,2))

target = np.array([0,0,1,0,1,1,1,0])
display(data,target)

train_test_split(data,target)

#随机拆分

kFold = KFold(n_splits=4)

#如果不写默认的话是分成三份,这里写的是分成四份

#train,test是索引，只要有索引便可以获取数据
#kFold.split(data,target)生成的是一个生成器，无法直接显示数据
for train,test in kFold.split(data,target):
    print(train,test)
    
#成功将数据分成了四份但是并没有按比例来划分

sKFold  = StratifiedKFold(n_splits=4)
#如果不写也默认分成三份
for train,test in sKFold.split(data,target):
    print(target[train],target[test])
    
#将数据划分为四份.每一份数据样本比例和原来一样

# train_test_split,KFold,StratifiedKFold作用都是将数据进行一个拆分
#只不过第一个是随机拆分，第二个是指定份数拆分但不保持原比例
#最后一个是指定拆分份数且保持原比例

陈陈的糖罐子

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
sklearn中数据拆分

导入包生成数据train_test_split拆分kFold拆分sKFold拆分小结：全部代码：import numpy as npimport pandas as pdfrom sklearn.neighbors import KNeighborsClassifierfrom sklearn.model_selection import train_test_split# cv int 6 数据分成6份from sklearn.model_selection i
复制链接

扫一扫