正规方程推导（Normal equation）

最新推荐文章于 2023-02-03 13:05:12 发布

复醉

最新推荐文章于 2023-02-03 13:05:12 发布

阅读量378

点赞数

分类专栏： coursera notes

本文链接：https://blog.csdn.net/welcom_/article/details/84311400

版权

coursera notes 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

微积分差不多都还回去了

法一：
$m为样例数目，\theta为列向量$
$h_\theta(x)=\theta_0+\theta_1x+...\theta_nx，J(\theta_0,\theta_1...+\theta_n)=\frac {1}{2m}\sum_{i=1}^m(h_\theta(x)^{(i)}-y^{(i)})^2$ $\frac{\delta}{\delta\theta_j}J(\theta_0,\theta_1+...\theta_n)=\frac {1}{m}\sum_{i=1}^m(h_\theta^{(i)}(x)-y^{(i)})x^{(i)}_j（j=0，1，...n）$ $其中任意偏导数可表示为\frac {1}{m}\sum_{i=1}^m(h_\theta^{(i)}(x)y^{(i)})x^{(i)}_j=x_j^T(X\theta-y)$ $x_j为相应列向量）然后让全部偏导数为0，综合可得到：$ $X^T*(X\theta-y)=0$ $X^TX\theta=X^Ty$ $\theta=(X^TX)^{-1}X^Ty$
法二： normal equation 推导思路
$先推导，用例数目m=2时，X=\begin{bmatrix} 1 & x_1^1 \\ 1 & x_1^2 \\ \end{bmatrix},Y= \begin{bmatrix} y_1^1 \\ y_1^2 \\ \end{bmatrix},\theta=\begin{bmatrix} \theta_1^1 \\ \theta_1^2 \\ \end{bmatrix}$
$h_\theta(x)=\theta_0+\theta_1x,J(\theta_0,\theta_1)=\frac {1}{2m}\sum_{i=1}^m(h_\theta^{(i)}(x)-y^{(i)})^2$ $将X,Y,\theta代入J(\theta_0,\theta_1)然后对\theta_0,\theta_1分别求偏导数，让$ $\frac{\delta}{\delta\theta_j}J(\theta_0,\theta_1)=0（j=0，1）$
$再对两个等式相加，经过整理就会发现，X^TX\theta=X^Ty-->\theta=（X^TX)^{-1}X^Ty$
$可想而知，经过推广，m=n时，也可以得出X^TX\theta=X^Ty-->\theta=（X^TX)^{-1}X^Ty$
normal equation vs gradient descent
正规方程：一步到位，算法复杂度为 $O(n^3)$ ，所以特征维度<10000时，使用normal equation。
梯度下降：选择 $\alpha$ 并调试它(很耗时间）,多次迭代(很耗时间)，特征参数很大时也ok。

复醉

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
正规方程推导（Normal equation）

normal equation 推导思路先推导，用例数目m=2时，X=[1x111x12],Y=[y11y12],θ=[θ11θ12]先推导，用例数目m=2时，X=\begin{bmatrix} 1 &amp;amp;amp;amp;amp; x_1^1 \\ 1 &amp;amp;amp;amp;amp; x_1^2 \\ \end{bmatrix},Y= \begin{bmatrix} y_1^1 \\ y_1^2 \\ \end{...
复制链接

扫一扫

专栏目录