线性回归是机器学习中训练数据集的重要手段,首先是简单的线性回归,用到的代码和数据集:数据集,代码
数据集图示:
![](https://i-blog.csdnimg.cn/blog_migrate/5c0f0a30e0023407330239da2b444540.png)
导入数据集&&拆分数据集
## 导入数据集
dataset = pd.read_csv('studentscores.csv')
X = dataset.iloc[ : , : 1 ].values
Y = dataset.iloc[ : , 1 ].values
## 拆分数据集
from sklearn.model_selection import train_test_split
X_train , X_test , Y_train , Y_test = train_test_split( X , Y , test_size = 1/4 , random_state = 0 )
使用简单线性回归模型训练数据集
使用LinearRegression中的模型训练数据集
regressor = LinearRegression()
regressor = regressor.fit( X_train , Y_train )
预测训练结果
使用LinearRegression库的predict函数预测训练结果:
Y_pred = regressor.predict( X_test )
预测的结果如下:
![](https://i-blog.csdnimg.cn/blog_migrate/f4e8badb8473c93b0f46ee54d1b5dff6.png)
结果可视化
使用matplotlib中的pyplot库可以将训练的数据集转化为图表,使结果可视化
plt.scatter ( X_train , Y_train , color = 'red' )
plt.plot ( X_train , regressor.predict(X_train) , color = 'blue' )
plt.show()
plt.scatter( X_test , Y_test ,color = 'red' )
plt.plot( X_test , Y_test , color = 'blue' )
plt.show()
训练集可视化图表为:
![](https://i-blog.csdnimg.cn/blog_migrate/57fa6f6e925936fa75a0c2c0e611033c.png)
![](https://i-blog.csdnimg.cn/blog_migrate/42fb9008f69fd595a0a5b895a59adb42.png)