机器学习第二周--Multiple features & Normal equation

最新推荐文章于 2022-02-15 03:34:13 发布

shiyongraow

最新推荐文章于 2022-02-15 03:34:13 发布

阅读量497

点赞数

分类专栏：机器学习机器学习笔记文章标签：机器学习线性回归多变量常规方程

本文链接：https://blog.csdn.net/shiyongraow/article/details/76315107

版权

机器学习同时被 2 个专栏收录

31 篇文章 1 订阅

订阅专栏

机器学习笔记

28 篇文章 5 订阅

订阅专栏

多变量的线性回归
常规方程
常规方程和梯度下降比较

多变量的线性回归

第一周内容针对单变量，也就是一个feature。这此考虑多变量，即多个features。
仍然与预测房价为例，影响房价的因素不只有面积，我们加入卧室数量、楼层、房龄，这些可看作新加入的feature。由此我们有以下表示：
这里写图片描述
m是样本数目，n是特征数目，X的上标表示第i个训练样本；X的下标表示第j个特征。

多变量

相应的推导多特征下的各种函数如下：
这里写图片描述
（为了方便向量化运算，取 $x_1$ =1）
梯度下降
把损失函数带入化简（化简过程见第一周）：

分解求 $\theta\$ 具体步骤如下：
Theta的具体求解
注意：这里x下标为0为1，是我们方便向量化在 $\theta_0\$ 项乘 $x_0$ 并置 $x_0$ =1（见上）。计算 $\theta_1\$ 时，只取第一个feature即 $x_1$ 计算。

特征缩放

特征缩放（feature scaling）：以预测房价为例，一个特征为房屋面积，如2000，而一个是房间内的卧室数量2间，很明显这俩个特征不在一个数量级别上，如果直接以这俩个特征进行运算，则迭代的速度非常慢，“以螺旋方式迭代收敛”，为加快迭代速度，采用特征缩放，来确保所有特征在相似的尺度，最好是每个特征缩放后的范围在[-1,1]，如本例，缩放房屋面积， $\frac{2000}{max \left(size \right)}$ ，卧室数量， $\frac{2}{max \left(numbers \right)}$ 。

均值归一化

对特征缩放后，我们再采用归一化操作：
这里采用的是均值归一化（ $x_0$ 不作归一化），均值归一化的结果是数据都转化到[0,1]内；以房屋面积为例， $x_1= \frac { size_1 - mean \left ( size \right )} {max\left(size\right) - min\left(size\right)}$ 。当分母用标准差代替，我们称为0均值归一化，0均值归一化的结果是均值为0，方差为1的数据集

学习速率

学习速率（ $\alpha\$ ）：同单特征一样，学习速率的选择尤为重要，以{0.001,0.01,0.1,1……}为标准，每项乘3穿插选择。

多项式回归

多项式回归：当线性回归拟合数据效果不好时，考虑多项式回归，其中假设函数选取不同，其他函数跟线性回归一样的。
考虑以下数据：

很明显随着size的不断增大，线性回归不能很好的拟合price了，这是考虑多项式，当采用第一个假设函数时，是一个二次函数，随着size的增大，price反而下降，明显不对，由数学知识， $\sqrt x\$ 的图像能很好的反应price的变化，所以用第二个函数做假设函数。

常规方程

常规方程（另一种计算 $\theta\$ 的方法）：损失函数一般是常规方程，如二次方程，三次方程等。以二次方程为例，对损失函数求偏导可得到theta。如下：

当然，用常规方程时我们给出一个通过公式求theta，以及具体的例子：
这里写图片描述

注意：这里的X矩阵包括 $x_0$ ！

常规方程和梯度下降比较

这里对常规方程和梯度下降作个比较：
这里写图片描述
总的来说：采用常规方程不用选择 $\alpha\$ ，不用进行特征缩放，也不用迭代，在特征小于10000维时可以考虑，当特征超过10000维，建议采用梯度下降。

shiyongraow

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习第二周--Multiple features & Normal equation

第一周内容针对单变量，也就是一个feature。这此考虑多变量，即多个features。仍然与预测房价为例，影响房价的因素不只有面积，我们加入卧室数量、楼层、房龄，这些可看作新加入的feature。由此我们有以下表示： m是样本数目，n是特征数目，X的上标表示第i个训练样本X的下标表示第j个特征。相应的推导多特征下的各种函数如下：（为了方便向量化运算，取x0=1）把损失
复制链接

扫一扫