提示:该文章不需要任何高数以外的数学基础(误),所有的公式亲姥姥式推导😙
如有错误,欢迎评论区留言指正噢
文章目录
开始
先准备梯度下降和正规方程分别需要的数据和目标
提示:梯度下降和正规方程都涉及到对
J
(
θ
)
J(\theta)
J(θ)的求偏导
有个错误❌
h
θ
(
x
i
)
h_{\theta}(x^i)
hθ(xi)=那里的等号右边的上角标应该都是i而不是1
补充:一些涉及到的矩阵运算
1. 关于矩阵乘法
2. 关于矩阵转置
3. 关于矩阵的逆
3.1 逆矩阵的定义
3.2 求逆矩阵
提示:半花括号里面的
A
b
1
A_{b_1}
Ab1为什么是负的,这和行列式的计算方法有关系,此处是按列求行列式,所以中间的
A
b
1
A_{b_1}
Ab1就是负的啦
3.3 关于 ( A − 1 ) T = ( A T ) − 1 (A^{-1})^T=(A^T)^{-1} (A−1)T=(AT)−1
提示:原矩阵和矩阵的转置行列式相同
4. 关于矩阵求导
续正规方程
提示:紫色部分的推导参见前面“紫色”的⭐
续梯度下降
提示:
1
o
1^o
1o那里的箭头是指“续正规方程”部分求偏导的结果
2
o
2^o
2o那里虚线下面的部分是试图将
θ
j
\theta_j
θj的代数表示和
1
o
1^o
1o那里的矩阵表示联系起来
总结
还是有一些对公式的理解不到位的,例如1.结合律那里只是通过维度大致理解了一下 2.两个矩阵的乘积求导为什么满足第一个求第二个不求加其二个求第一个不求
欢迎大家补充和讨论!!!