【python机器学习100天—2022年】Day2-简单线性回归_训练集使用简单线性回归模型进行训练-CSDN博客

本文链接：https://blog.csdn.net/weixin_44179010/article/details/124614058

大家好，我是ly甲烷😜，后端开发也有做算法的心呀💗 ，我们来学习python机器学习
github有37.1k star的机器学习100天原项目地址https://github.com/Avik-Jain/100-Days-Of-ML-Code
之前的机器学习100天有很多库或者函数已经不用了，还有刚入门机器学习可能很多函数或者设置搞不明白，
所以，从python基础无缝到机器学习的教程来了。博主亲自操作一遍过的记录，绝对细致。如果学不会可以评论区讨论，如果我懂，我会回复的。

今天是机器学习第二天——简单线性回归 👇 👇 👇。前一天——数据预处理。

数据集

链接：https://pan.baidu.com/s/1Y2vZ5Rvn2PpRkj9XhnZrXQ?pwd=yyds
提取码：yyds

1.数据预处理

import pandas as pd
from sklearn.model_selection import train_test_split
# 第一步：数据预处理
dataset = pd.read_csv(r'E:\workspace\python_workspace\datasets\studentscores.csv')
X = dataset.iloc[:, :1].values
Y = dataset.iloc[:, 1].values

X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=1/4, random_state=0)

2.使用简单线性回归模型来训练训练集

from sklearn.linear_model import LinearRegression
# 第二步：训练集使用简单线性回归模型来训练
regressor = LinearRegression()  # 线性模型分类器 
regressor = regressor.fit(X_train, Y_train)   # 训练集放模型里训练

3.预测结果

# 第三步：预测结果
Y_pred = regressor.predict(X_test)  # 训练完之后训练器就可以预测结果啦

4.可视化显示

import matplotlib.pyplot as plt
# 训练集结果可视化
plt.scatter(X_train, Y_train, color='red')  # 绘制实际数据的散点图
plt.plot(X_train, regressor.predict(X_train), color='blue')   # 绘制预测的直线

# 测试集结果可视化
plt.scatter(X_test, Y_test, color='red')
plt.plot(X_test, regressor.predict(X_test), color='blue')
plt.show() # 展示图像

最终结果

训练集可视化结果：
在这里插入图片描述
预测集可视化结果

蓝色直线是预测的结果，红点是数据实际的分布，可以看到，预测的结果还不错。

函数学习

matplotlib.pyplot.scatter ：散点图
matplotlib.pyplot.plot ：绘制为线条

plt.plot() 函数详解：https://zhuanlan.zhihu.com/p/258106097

今日总结：
完整的机器学习流程差不多就是这样：数据预处理——训练模型——预测结果——可视化显示
当然最强的是搭建模型😜，我们先学会用别人搭建好的模型吧~
第三天：多元线性回归 https://blog.csdn.net/weixin_44179010/article/details/124637750