python机器学习---监督学习---线性回归模型（用于回归）

最新推荐文章于 2024-07-19 03:18:54 发布

anne_wang_swufe

最新推荐文章于 2024-07-19 03:18:54 发布

阅读量1.2k

点赞数 2

分类专栏： python机器学习

本文链接：https://blog.csdn.net/weixin_42156897/article/details/94128633

版权

本文介绍了线性回归模型的基本原理，包括线性模型的一般公式和图形表示。接着讨论了不同类型的线性模型，如一般线性回归、岭回归和套索回归，以及它们在防止过拟合方面的差异。最后，通过糖尿病数据集展示了线性模型的应用及其可能存在的过拟合问题。

摘要由CSDN通过智能技术生成

备注：本文主要来自于对《深入浅出python机器学习》书籍的学习总结笔记，感兴趣的同学可以购买本书学习

1、线性模型基本原理

1.1 线性模型一般公式

线性模型在拟合数据集时，会让自己距离每个数据点的加和为最小值，即找到找到训练数据集中y的预测值和真实值的平方差的最小值，这也是线性回归模型的基本原理，线性回归也称为最小二乘法。

使用线性模型的前提条件，是假设目标y是数据特征的线性组合。

1.2 线性模型图形表示

##1-数据准备
#导入sklearn.datasets的make_regression数据集
from sklearn.datasets import make_regression
X, y = make_regression(n_samples=50, n_features=1, n_informative=1,
                       noise=50,random_state=1)

##2-数据建模
#导入算法包
from sklearn.linear_model import LinearRegression
#使用算法
reg = LinearRegression()
#模型训练
reg.fit(X,y)
#绘制拟合图
%matplotlib inline
import matplotlib.pyplot as plt
plt.scatter(X,y,c='b',s=60)

##3-模型应用
#导入待预测数据
import numpy as np
z = np.linspace(-3,3,200).reshape(-1,1)
plt.plot(z, reg.predict(z),c='k')
plt.title('Linear Regression')
#打印线性方程
print('直线的斜率是：{:.2f}'.format(reg.coef_[0]))
print('直线的截距是：{:.2f}'.format(reg.intercept_))