正规方程

区别与使用迭代的梯度下降法,正规方程可以一次性求出最有解(基本只需要一步),
在这里插入图片描述
到目前为止,我们一直使用梯度下降法求最优解,为了最小化代价函数,使用了迭代算法,经过梯度下降的多次迭代来收敛到全局最优解,相反,正规方程提供了一种求θ的解析解法,所以可以一次性求出最优解
先举个例子
J(θ)=aθ2+bθ+c
吧θ看成一个数字而不是一个向量,不用解一元二次的知识,学过微积分的我们想的是对j(θ)求导,导数=0,解得θ。
可是,θ不是一个数字,它代表一个向量,J是关于向量的函数,学过偏导数后,我们知道了要对每一个方向求偏导,这样令各个偏导后的式子都为0,借得所有的值,
在这里插入图片描述
这就是θ得最优解
换一种方法
在这里插入图片描述
在这里插入图片描述

怎么理解这个函数呢?
首先(xT*x)-1是(xT*x)的逆矩阵(不是转置,这不一样),
在这里插入图片描述
用python语言实现矩阵的转置和逆。

在以前,特征缩放和特征变量在相似范围内,如果你使用正规方程,那么就不需要特征缩放。
最后,何时用梯度下降,何时用正规方程。假如你拥有m个训练样本,n个特征变量,梯度下降的缺点是你需要选择学习速率α,这通常表示你需要运行多次尝试不同的学习速率α,找到运行效果最好的那个,梯度下降的另一个缺点是你需要经过更多次的迭代,计算会变慢。可是梯度下降法在特诊变量很多的情况下,也能运行的相当好,至于特征方程,要有这么一步运算(xTx)-1,这是一个nn维度的运算,并且在求解逆矩阵时,通常只比nnn快一点,所以在特征量多的时候,正规方程会变得很慢,比梯度下降慢。所以当特征变量n上万时,便开始考虑使用梯度下降更有优势。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值