正规方程法

正规方程


正规方程提供了一种求 θ \theta θ的解析解法,不再需要运行迭代算法,而是可以直接一次性的求解 θ \theta θ的最优解。

image-20220112194653177

利用高等数学知识,我们知道可以利用求导的方法来求解 J ( θ ) J(\theta) J(θ)的最小值,若 θ \theta θ表示的是n+1维向量,则对 θ j \theta_j θj逐个求偏导

举个栗子:

image-20220112195637839

最下面这个方程的结果就是使得代价函数最小化的 θ \theta θ。使用正规方程法求解 J ( θ ) J(\theta) J(θ)的最小值时,不需要进行特征缩放。

如何选择梯度下降法还是正规方程法?

梯度下降的缺点: 需要选择学习速率 α \alpha α,这通常表示要运行很多次来尝试不同的 α \alpha α;需要多次的迭代,就算可能会很慢。

梯度下降的优点: 在特征变量很多的情况下也能运行地相当好。

正规方程的缺点: 计算 ( X T X ) − 1 (X^TX)^{-1} (XTX)1这一项时,不仅要求 X T X X^TX XTX得到的矩阵满秩,而且计算逆矩阵的代价大概是以矩阵维度的三次方增长,时间复杂度大概是 O ( n 3 ) O(n^3) O(n3)。所以当矩阵维数n过大(通常是上万)时,计算会变得非常缓慢,此时选择梯度下降法效率会更高。

如果 X T X X^TX XTX不可逆怎么办?

不可逆的原因:

(1)矩阵中的两个特征之间存在线性变换关系(线性相关),矩阵不满秩;

(2)n>m(未知数个数>方程个数),方程组有无穷多个解。

Octave里面求逆的函数有两个:pinv和inv,前者是伪逆,后者是逆。数学上可以证明,只要使用pinv就能计算出想要的 θ \theta θ值,即使是在 X T X X^TX XTX不可逆的情况下。

X T X X^TX XTX是奇异矩阵时,首先看特征里是否有一些多余的特征可以删除,然后调整特征个数,可以选择删除一些影响不大的特征,防止n>m的情况发生。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值