[ML笔记]多元线性回归

最新推荐文章于 2023-01-25 17:14:43 发布

古希腊小斑鸠

最新推荐文章于 2023-01-25 17:14:43 发布

阅读量458

点赞数

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/cicocogood21/article/details/75331903

版权

机器学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

才发现这篇文档在草稿箱里呆了一个多星期了，上周因为公司的一个事情，第二周的Coursera课程没有完成～～|||

引言

引言被笔者吃了。

多元特征(Multiple Feature)

多元特征示例

内容	含义
ｍ	训练样本个数
n	特征个数，比如有 $θ_1,θ_2,θ_3,θ_4那么n=4$
$x^{(i)}$	第ｉ个训练样本的所有输入特征，可以认为是一组特征向量
$x_j^{(i)}$	第i个训练样本第j个特征的值，即特征向量第ｊ个值

多元假设函数表达式如下
$h_θ(x) =θ_0+θ_1x_1+θ_2x_2+θ_3x_3+....+θ_nx_n$

使用矩阵来表示这个表达式可以表示为：
$h_θ(x) = [\begin{matrix} θ_0 & θ_1 & θ_2 & ... & θ_n \end{matrix}][\begin{matrix} x_0 \\ x_1 \\ x_2 \\ ... \\ x_n \end{matrix}]=θ^Tx$
我们规定 $x_0^{(i)}=1(i\in1,......m)$ ，因此上式等式可以成立。

多元特征的梯度下降

上上一篇讲梯度下降的博文，推导了 $θ_0，θ_1$ 的计算方法，这里就不再赘述，不懂的朋友看文章，这里直接给出 $θ_j$ 的计算方法：
repeat util convergence: {

　　 $θ_j :=θ_j-α\frac{1}{m}\sum_1^m((h_θ(x^{(i)})-y^{(i)})x_j^{(i)}) j:=0,..,n$
　　　
}

因为 $x_0^{(i)}=1(i\in1,......m)$ ，所以这个算法和旧算法一致，
算法原理

梯度下降方法：特征缩放

特征缩放原理

如果两个特征变量，在不同维度之间的取值范围相差较大的化，会使我们在使用梯度下降算法的时候，因维度差异造成代价函数收敛发生震荡，而导致收敛速度较慢。如下图所示，
特征缩放目的
为了解决这个问题，我们引入特征缩放，将特征值通过某些算法，将特征值锁到一个相似的取值范围内，以加快收敛速度，这个取值范围比如
$−1 ≤ x(i) ≤ 1　或　−0.5 ≤ x(i) ≤ 0.5$
都是可以的，那么最后收敛过程可能如上图右所示。

特征缩放算法

有两种技术可以帮助我们解决该问题：均值归一化和特征缩放。
特征缩放：直接将输入值除以输入变量范围的最大值（如最大值-最小值），来将输入取值范围缩小到1。
均值归一：将输入值减去取值平均值，然后除以输入变量范围差值，或者是除以输入变量标准差。公式如下，
$x_i:=\frac{x_i-μ_i}{s_i}$
其中， $μ_i$ 指输入变量x的平均值， ${s_i}$ 是指输入变量范围差值