机器学习算法之线性回归（linear regreesion）

最新推荐文章于 2021-09-29 08:23:47 发布

9完美并不美

最新推荐文章于 2021-09-29 08:23:47 发布

阅读量554

点赞数

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010057965/article/details/80523796

版权

linear regreesion（线性回归）

我们将用来描述回归问题的标记如下:

$m$ 代表训练集中实例的数量

$n$ 代表特征的数量

$x^{(i)}$ 表示第 $i$ 个训练实例，是特征矩阵的第i行，是一个向量

$x_j^{(i)}$ 表示特征矩阵中第 $i$ 行的第 $j$ 个特征，也就是第 $i$ 个训练实例的第 $j$ 个特征

$y$ 代表目标变量，也就是输出变量

$(x,y)$ 代表训练集中的一个实例

$(x^{(i)},y^{(i)})$ 代表第 $i$ 个观察实例

$h$ 代表学习算法的函数，或者加假设（hypothesis）

对于多变量线性回归，假设函数可以设为

h θ (x) = θ 0 + θ 1 x 1 + θ 2 x 2 + . . . + θ n x n

$h_{\theta}(x) = \theta_0+\theta_1x_1 + \theta_2x_2 +...+\theta_nx_n$
为了使公式能够简化，引入

x0=1 x 0 = 1 $x_0=1$ ,则假设函数变为

h θ (x) = θ 0 x 0 + θ 1 x 1 + θ 2 x 2 + . . . + θ n x n

$h_{\theta}(x) = \theta_0x_0+\theta_1x_1 + \theta_2x_2 +...+\theta_nx_n$ ,进行向量化后，最终结果为

h θ (x) = θ T X

$h_{\theta}(x) = \theta^TX$

我们需要求出 $\theta$ ,使得对于每一个样本，带入到假设函数中，能得到对应的一个预测值，而我们的目标，是使求出的预测值尽可能的接近真实值

通过最大似然估计来推导目标函数

由于我们实际预测的值和真实值之间肯定会有误差，对于每个样本:

y (i) = θ T x (i) + ε (i)

$y^{(i)} = \theta^Tx^{(i)} + \varepsilon^{(i)}$ 其中，

y(i) y ( i ) $y^{(i)}$ 为当前样本实际真实值，

θTx(i) θ T x ( i ) $\theta^Tx^{(i)}$ 为预测结果，

ε(i) ε ( i ) $\varepsilon^{(i)}$ 即为预测误差

对于整个数据集来说，则：

Y = θ T X + ε

$Y = \theta^TX + \varepsilon$

误差 $\varepsilon^{(i)}$ 是独立的并且具有相同的分布，并且服从均值为0，方差为 $\theta^2$ 的正态分布

由于误差服从正态分布，所以：

p (ε (i)) = 1 2 π - - \sqrt σ e x p ⟮ - ( ε ( i ) )

最低0.47元/天解锁文章

9完美并不美

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
机器学习算法之线性回归（linear regreesion）

linear regreesion（线性回归）我们将用来描述回归问题的标记如下:mmm 代表训练集中实例的数量nnn 代表特征的数量x(i)x(i)x^{(i)} 表示第iii个训练实例，是特征矩阵的第i行，是一个向量x(i)jxj(i)x_j^{(i)} 表示特征矩阵中第iii行的第jjj个特征，也就是第iii个训练实例的第jjj个特征yyy 代表目标变量，也就是输出变量...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。