API解析----------sklearn中的train_test_split()用法

最新推荐文章于 2024-07-19 03:14:54 发布

西安人走哪都要吃泡馍

最新推荐文章于 2024-07-19 03:14:54 发布

阅读量901

点赞数

分类专栏： API解析文章标签：机器学习

本文链接：https://blog.csdn.net/data_curd/article/details/112555230

版权

API解析专栏收录该内容

6 篇文章 0 订阅

订阅专栏

在机器学习中，得到样本数据后需要分为训练数据和测试数据，这时就会用到train_test_split()函数，
train_test_split():用于样本切分为训练集和测试集两个数据集，
例如：

x_train,x_test,y_train,y_test = train_test_split(x,y,test_size = 0.3,random_state = 42)

其中参数：
x:样本中的特征数据
y:样本中的结果数据
test_size:训练集和测试集数据量的占比，如果是0.3则表示训练为70，测试为30
random_state:随机数的种子，但是这我目前不是太懂，等研究透了我在回来修改，

import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split

x,y = np.arange(200).reshape(100,2),range(100)
x_train,x_test,y_train,y_test = train_test_split(x,y,test_size = 0.3,random_state = 42)
print(x_train.shape[0]) # 70
print(x_test.shape[0]) # 30