线性回归[1]

最新推荐文章于 2024-05-25 00:45:00 发布

DisguiseR6

最新推荐文章于 2024-05-25 00:45:00 发布

阅读量178

点赞数

分类专栏： # 机器学习算法文章标签：线性回归

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_25614773/article/details/88064056

版权

机器学习算法专栏收录该内容

8 篇文章 0 订阅

订阅专栏

线性回归算法梳理

文章目录

线性回归算法梳理

在这里插入图片描述

1机器学习概念

有监督学习

训练数据有标记信息，形式：给定一个输入 $x$ ,学习预测一个输出 $t$ —根据输出形式可分为：回归、分类
无监督学习

训练数据没有标记信息
泛化能力

该方法学习到的模型对未知数据的预测能力
过拟合

一味追求对训练数据的预测能力，所选模型的复杂度往往会比真实模型更高的现象

解决方法：正则化
欠拟合

与‘过拟合’相对，对训练样本的一般性尚未学好

解决方法: 1增加新特征 2 增加模型的复杂度
方差和偏差

泛化误差 = 偏差 + 方差 + 噪声

偏差：学习算法的期望预计与真实结果的偏离程度

方差：同等大小的训练集的变动所导致的学习性能的变化
交叉验证

1.简单交叉验证

2.S折交叉验证

3.留一交叉验证（Leave-one-out Cross Validation）

2 线性回归的原理

线性回归：试图学得一个线性模型以尽可能准确地预测实值输出标记
$f(x_i) = wx_i+ｂ，使得f(x_i) \simeq y_i$

3 线性回归

损失函数: 单个样本的误差
$f(x_i)-y_i|$
代价函数: 整个训练集上所有样本误差的平均
$\frac{1}{m}\sum_{i=1}^{m}(f(x_i)-y_i)^2$
目标函数 ：代价函数 + 正则化项
$\frac{1}{m}\sum_{i=1}^m \ (f(x_i)-y_i)^2+正则化$

4 优化方法

梯度下降法

考虑无约束问题
$\min f(x),\ x\in\mathbf{R^n}$
$f (x)$ 具有一阶连续偏导数， $f (x)$ 在 $x^{(k)}$ 附近一阶泰勒展开：
$=f(x^{k})+\nabla f(x^{(k)})^T(x-x^{(k)})$
第 $k + 1 $ 次的迭代值 $x^{k+1}$ :
$x^{(k+1)}\gets \ x^{(k)}+ \lambda_k \ p_k$
其中 $p_k=-\nabla\ f(x{^{k}})$ 为搜索方向

$\lambda_k$ 是步长，由一维度搜索确定：
$f(x^{(k)}+ \lambda_k p_k）=\min\limits_{\lambda\geq0}f(x^{(k)}+\lambda p_k)$
牛顿法

考虑无约束问题
$\min f(x),\ x\in\mathbf{R^n}$
$f (x)$ 具有二阶连续偏导数， $f (x)$ 在 $x^{(k)}$ 附近二阶泰勒展开：
$f(x)\simeq\phi(x) =f(x^{k})+\nabla f(x^{(k)})^T(x-x^{(k)})+\frac{1}{2}(x-x^{(k)})^T\nabla^2 f(x^{(k)})(x-x^{(k)})$
$\nabla^2 f(x^{(k)})$ 是 $f (x)$ 在 $f(x^{(k)})$ 处的Hesse矩阵

为了求 $\phi(x)$ 的极小值点
$\nabla\phi(x)=0 \ （\phi(x)取极值的必要条件）$
有：
$\nabla f(x^{(k)})+\nabla^2 f(x^{(k)})(x-x^{(k)})=0$
由牛顿法的迭代公式：
$x^{(k+1)} = x^{(k)}+\nabla^2 f(x^{(k)})^{-1}\nabla f(x^{(k)})$
拟牛顿法

在牛顿法的迭代中，需要计算Hesse矩阵的逆矩阵，这一个计算比较复杂，考虑用一个矩阵代替Hesse矩阵的逆

5 线性回归的评估指标

RMSE/MSE/MAE

R-Squared

Adjustd R-Squared

F Statistics

RMSM 均方根误差
$\sqrt {\frac{1}{m}\sum_{i=1}^m(f(x_i)- y_i)^2}$
MSE均方误差
$MAE=\frac{1}{m}\sum_{i=1}^m(f(x_i)- y_i)^2$
MAE绝对误差
$=\frac{1}{m}\sum_{i=1}^m|f(x_i)- y_i|$

6 sklearn参数详情

sklearn.linear_model.LinearRegression()

参考：(sklearn)逻辑回归linear_model.LogisticRegression用法

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
线性回归[1]

线性回归算法梳理## 1 机器学习概念有监督学习训练数据有标记信息，形式：给定一个输入xxx,学习预测一个输出ttt—根据输出形式可分为：回归、分类无监督学习训练数据没有标记信息泛化能力该方法学习到的模型对未知数据的预测能力过拟合一味追求对训练数据的预测能力，所选模型的复杂度往往会比真实模型更高的现象解决方法：正则化欠拟合与‘过拟合’相对，对训练样本...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。