线性回归笔记

最新推荐文章于 2023-03-20 13:26:25 发布

小小逐月者

最新推荐文章于 2023-03-20 13:26:25 发布

阅读量677

点赞数 1

分类专栏： Scikit Learning 数学 Python 机器学习

本文链接：https://blog.csdn.net/hezhefly/article/details/79597909

版权

Python 同时被 3 个专栏收录

10 篇文章 1 订阅

订阅专栏

数学

5 篇文章 1 订阅

订阅专栏

机器学习

3 篇文章 0 订阅

订阅专栏

线性回归

一、原理

1.1 定义

寻找一条直线，最大程度“拟合”样本特征（X_data）和样本输出标记（Label）之间的关系。

1.2 解决的问题

分类问题和回归问题

二、简单线性回归（Sample Linear Regression Model）

2.1 公式推导

假设最佳拟合的直线方程为 $\color{red}{y=wx+b}$ ，则有每一个样本点 $\color{red}{x^{(i)}}$ 就存在一个真实值 $\color{red}{y^{(i)}}$ 与其对应；
根据我们预测的直线方程 $\color{red}{\hat y^{(i)}=wx^{(i)}+b}$ ，我们希望 $\color{red}{y^{(i)}}$ 和 $\color{red}{\hat y^{(i)}}$ 的差距尽量小；
那么我可以构造一个损失函数 $\color{red}{loss=\sum_{i=1}^n(y^{(i)}-\hat y^{(i)})^2}$ ，我的目标就是让损失函数尽可能的小；
将我们的预测函数 $\color{red}{\hat y^{(i)}=wx^{(i)}+b}$ 带入损失函数中，得到
$\color{red}{loss=\sum_{i=1}^n(y^{(i)}-wx^{(i)}-b)^2}$
其中 $\color{red}{x^{(i)}}$ 与 $\color{red}{y^{(i)}}$ 均为已知量，我们需要找到w和b是loss的值尽可能小，这里需要使用最小二乘法；
通过最小二乘法求得：
$\begin{align} w&=\frac{\sum_{i=1}^n\left(x^{(i)}-\bar x\right)\left(y^{(i)}-\bar y\right)}{\sum_{i=1}^n\left(x^{(i)}-\bar x\right)^2}\notag\\ \notag\\ b&=\bar y-w\bar x\notag \end{align}$

2.2 流程图

简单线性回归

2.3 代码实现

x_train =np.array([1.,2.,3.,4.,5.])
y_train =np.array([1.,3.,2.,3.,5.])
x_mean=np.mean(x_train)#x平均值
y_mean=np.mean(y_train)#y平均值
fraction_up=0.0#w的分子
fraction_down=0.0#w的分母
for x_i,y_i in zip(x_train,y_train):
    fraction_up+=(x_i-x_mean)*(y_i-y_mean)#分子加和
    fraction_down+=(x_i-x_mean)**2#分母加和
w=fraction_up/fraction_down#计算w
b=y_mean-w*x_mean#计算b
y_hat=w*x_train+b#构造预测函数

简单回归图像

2.4、向量化处理

x_train =np.array([1.,2.,3.,4.,5.])
y_train =np.array([1.,3.,2.,3.,5.])
x_mean=np.mean(x_train)#x平均值
y_mean=np.mean(y_train)#y平均值
fraction_up=(x_train-x_mean).dot(y_train-y_mean)#w的分子（修改此处）
fraction_down=(x_train-x_mean).dot(x_train-x_mean)#w的分母（修改此处）
w=fraction_up/fraction_down#计算w
b=y_mean-w*x_mean#计算b
y_hat=w*x_train+b#构造预测函数

三、多元线性回归（Multivariable Linear Regression Model）

3.1 公式推导

对于一般的数据集 $D$ （ $D=\{(x_i,y_i)\}_{i=1}^n$ ），样本存在d个特征，则线性回归公式为

$y=w^TX+b$
令

b = w 0 X 0 ( X 0 ≡ 1 ) $b=w_0X_0(X_0\equiv1)$ ，则

$y=\theta X$ 其中

$\begin{align} \theta&=(w_0,w_1,w_2,w_3,\ldots,w_n)^T\notag\\ \notag\\ X&=\begin{bmatrix} 1 & X_1^{(1)} & X_2^{(1)}&\cdots& X_n^{(1)} \\ 1 & X_1^{(2)} & X_2^{(2)}&\cdots& X_n^{(2)} \\ \vdots&\vdots&\vdots&\ddots&\vdots\\ 1 & X_1^{(d)} & X_2^{(d)}&\cdots& X_n^{(d)} \\ \end{bmatrix}\notag\\ \notag\\ y&=(y_0,y_1,y_2,y_3,\ldots,y_n)^T\notag\\ \end{align}$
同样2.1一样构造损失函数，然后使用最小二乘法，求得正规方程解

θ $\theta$ （Normal Equation）

$\theta=(X^TX)^{-1}X^Ty$

3.2 优缺点

缺点：时间复杂度高，约n³的复杂度。
优点： $\theta$ 的结果是依赖矩阵运算得来，不依赖空间距离（不受特征量纲影响），所以数据集不需要做归一化处理。

3.3代码实现

在实现代码前，先明确sklearn中定义的两个参数名称截距（intercept）和系数（coefficients）：

$\theta=\begin{pmatrix} \ \ \ \ \ \ \theta_0\to\text{截距intercept_ }\\ \left. \begin{array}{l}\theta_1\\ \theta_2&\\ \theta_3&\\ \vdots&\\ \theta_n&\\ \end{array} \right\}\text{系数coef_ } \end{pmatrix}$

'''这里只列出核心计算代码'''
X=np.hstack([np.ones((len(X_train),1)),X_train])#对原X数据集增加一列常数项1
theta=np.linalg.inv(X.T.dot(X)).dot(X.T).dot(y_train)#np.linalg.inv矩阵求逆
intercept=theta[0]#截距
coef=theta[1:]#系数
###############预测y###############
X_t=np.hstack([np.ones((len(X_test),1)),X_test])#对原X数据集增加一列常数项1
y_hat=X_t.dot(theta)#构造预测函数,计算y_hat
'''之后可用R²对y_hat和y_test进行比较评分'''

四、sklearn实现多元线性回归

import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression

boston=datasets.load_boston()#加载数据集
X=boston.data#分离X
y=boston.target#分离y
X=X[y<50.0]#去掉房价中高于50的样本点，该样本点定义房价大于50的部分恒为50，该值影响预测准确性
y=y[y<50.0]
X_train,X_test,y_train,y_test=train_test_split(X,y,random_state=666)#切分训练集和测试集
lin_reg=LinearRegression()#实例化线性回归模型
lin_reg.fit(X_train,y_train)#训练样本
y_hat=lin_reg.predict(X_test)#预测y
lin_reg.score(X_test,y_test)#获取得分R²
print("该模型截距为：",lin_reg.intercept_)#输出截距
print("该模型系数为：",lin_reg.coef_)#输出系数

小小逐月者

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
线性回归笔记

线性回归一、原理1.1 定义寻找一条直线，最大程度“拟合”样本特征（X_data）和样本输出标记（Label）之间的关系。1.2 解决的问题分类问题和回归问题二、简单线性回归（Sample Linear Regression Model）2.1 公式推导假设最佳拟合的直线方程为y=wx+by=wx+by=wx+b\color{red}{y=wx...
复制链接

扫一扫

专栏目录