目录
1.简介
train_test_split
是 sklearn
库中的一个函数,用于将数据集分割为训练集和测试集。
2.参数说明
train_test_split(*arrays, test_size=None, train_size=None, random_state=None, shuffle=True, stratify=None)
-
*arrays
:一个或多个数组样例,可以是NumPy数组、Pandas DataFrame或任何其他序列类型。这些数组将根据指定的比例被分割。 -
test_size
:单个浮点数,表示测试集占总数据的比例。如果设置,train_size
将被忽略。默认值为0.25,即测试集占25%。 -
train_size
:单个浮点数或整数,表示训练集占总数据的比例或具体的样本数量。如果设置了test_size
,则此参数将被忽略。 -
random_state
:随机数生成器的种子。如果为整数,random_state
将固定随机数生成器的状态,这有助于确保结果的可重复性。如果为None
(默认值),则每次运行结果可能不同。 -
shuffle
: