X_train. y_train,X_test,y_test区别
小白初学
scikit-learn中的数据通常用大写的X表示,而标签用小写的y表示
例如经典的鸢尾花示例:
from sklearn. mordel_slection import train_test_split
X_train, y_train,X_test,y_test =train_test_split(iris_datasets[‘data’],iris_dataset[‘target’],random_state =0)
data:花萼长度,花萼宽度,花瓣长度,花瓣宽度的测量数据(格式为Numpy数组)
target:测量过的每朵花的品种
数据拆分之前,train_test_split函数利用伪随机数生成器将数据集打乱。
代码来源:python机器学习基础教程
x train 和x test区别链接:https://blog.csdn.net/lichunxia516/article/details/107707336
初次接触机器学习小白,理解可能有误,欢迎大神指正。