机器学习中为什么需要梯度下降_机器学习——多元梯度下降

最新推荐文章于 2022-06-21 10:54:05 发布

weixin_39534002

最新推荐文章于 2022-06-21 10:54:05 发布

阅读量117

点赞数

文章标签：机器学习中为什么需要梯度下降梯度下降参数不收敛梯度下降算法

一、多维特征

前面所述的房价预测的线性模型，只用到了一维特征，即size，房屋尺寸，要用这个特征量来预测房屋价格：

当数据集的信息不止一种时，便有了多维特征，比如：

上图有四个X，即四个特征，来预测房屋价格。于是房价预测的假设函数h(x)也从一元线性回归变成了多元线性回归：

上述假设函数中的θo可以看作：有一个额外的Xo ，Xo = 1 。那么多元线性回归的假设函数可以简化成：θ的转置乘以X (θ和X都可看作n+1维向量)

二、多元梯度下降法

与一元线性回归的代价函数与多元线性回归的代价函数都是针对所有的θ，只是多元线性回归的θ个数更多，

梯度下降算法的实质也是一样的，如果不清楚可看往期内容:机器学习——梯度下降、梯度下降的线性回归算法(https://mp.weixin.qq.com/s?__biz=Mzg2MDExMTU3NA==&mid=2247483916&idx=3&sn=6d56f2f60ed834b2f97bd1893b64dd07&chksm=ce2a15b5f95d9ca3cdfbc96acc24cdc5f4a957a4633a7d72826465923a997ce4c5197b9561e7&token=247129081&lang=zh_CN#rd)

计算代价函数J(θ)的python代码实现：

def computeCost(X, y, theta):    inner = np.power(((X * theta.T) - y), 2)    return np.sum(inner) / (2 * len(X))

三、梯度下降之特征缩放

面对多维特征问题的时候，保证这些特征都具有相近的尺度，这将帮助梯度下降算法更快地收敛。当各个特征间的数值差距很大，梯度下降算法需要非常多次的迭代才能收敛。以房价问题为例，假设我们使用两个特征，房屋的尺寸和房间的数量，尺寸的值为 0-2000平方英尺，而房间数量的值则是0-5，以两个参数分别为横纵坐标，绘制代价函数的等高线图，能看出图像会显得很扁，梯度下降算法需要非常多次的迭代才能收敛。