输出
5.拆分训练集和测试集
训练集测试集拆开 百分之75用于训练 百分之25用于测试
random_state 在需要设置random_state的地方给其赋一个值,当多次运行此段代码能够得到完全一样的结果,别人运行此代码也可以复现你的过程。若不设置此参数则会随机选择一个种子,执行结果也会因此而不同了。虽然可以对random_state进行调参,但是调参后在训练集上表现好的模型未必在陌生训练集上表现好,所以一般会随便选取一个random_state的值作为参数。
X_train,X_test,Y_train,Y_test = train_test_split(X,Y,random_state=1);
print(X_train.shape," “,X_test.shape,” “,Y_train.shape,” ",Y_test.shape);
输出
6.线性回归
sklearn线性回归
lrg = LinearRegression();
model = lrg.fit(X_train,Y_train); #训练
print(model);
print(lrg.intercept