机器学习笔记(第三章)

机器学习(周志华著) Datawhale打卡第二天

第三章

一些重要公式和结论的推导
  • 多维最小二乘法的解

设均方误差 E ω ^ = ( y − X ω ^ ) T ( y − X ω ^ ) E_{\hat{\omega} }=(y-X\hat{\omega})^T(y-X\hat{\omega}) Eω^=(yXω^)T(yXω^),其中 ω ^ = ( ω b ) \hat{\omega}=(\begin{matrix} \omega\\b\end{matrix}) ω^=(ωb)

E ω ^ = ( y T − ω ^ T X T ) ( y − X ω ^ ) E_{\hat{\omega}}=(y^T-\hat{\omega}^TX^T)(y-X\hat{\omega}) Eω^=(yTω^TXT)(yXω^)

= y T y − ω ^ T X T y − y T X ω ^ + ω ^ T X T X ω ^ =y^Ty-\hat{\omega}^TX^Ty-y^TX\hat{\omega}+\hat{\omega}^TX^TX\hat{\omega} =yTyω^TXTyyTXω^+ω^TXTXω^

求偏导数 ∂ E ω ^ ∂ ω ^ = − X T y − X T y + 2 X T X ω ^ = 2 X T ( X ω ^ − y ) \frac{\partial{E_{\hat{\omega}}}}{\partial{\hat\omega}}=-X^Ty-X^Ty+2X^TX\hat{\omega}=2X^T(X\hat{\omega}-y) ω^Eω^=XTyXTy+2XTXω^=2XT(Xω^y)

X T X X^TX XTX是半正定矩阵时,问题 m i n E ω ^ minE_{\hat{\omega}} minEω^为凸优化,此时可令 ∂ E ω ^ ∂ ω ^ = 0 \frac{\partial{E_{\hat{\omega}}}}{\partial{\hat\omega}}=0 ω^Eω^=0得到最优解

此时,当 X T X X^TX XTX是可逆矩阵,可得 ω ^ ∗ = ( X T X ) − 1 X T y \hat{\omega}^{*}=(X^TX)^{-1}X^Ty ω^=(XTX)1XTy

  • 一些用到的矩阵与向量求导法

∂ a T x ∂ x = a \frac{\partial{a^Tx}}{\partial x}=a xaTx=a ∂ x T a ∂ x = a \frac{\partial x^Ta}{\partial x}=a xxTa=a

∂ x T a x x = 2 a x \frac{\partial x^Tax}{x}=2ax xxTax=2ax

  • 向量投影

对于投影方向 w w w x x x w w w方向上的投影为: w T x w^Tx wTx或者 x T w x^Tw xTw

举例:

设 w 方 向 上 有 向 量 w ^ = ( 4 , 4 ) T , x = ( 1.2 , 2 ) T 设w方向上有向量\hat w=(4,4)^T,x=(1.2,2)^T ww^=(4,4)T,x=(1.2,2)T

那 么 w ^ T x = x T w ^ = 12.8 那么\hat w^Tx=x^T\hat w=12.8 w^Tx=xTw^=12.8

此 时 计 算 x 在 w ^ 向 量 上 的 投 影 向 量 为 x ^ = ( ( 1. 2 2 + 2 2 ∗ ( c o s ( t a n − 1 ( 2 1.2 ) − 45 ) ) ∗ c o s 45 , ( 1. 2 2 + 2 2 ∗ ( c o s ( t a n − 1 ( 2 1.2 ) − 45 ) ) ∗ s i n 45 ) T = ( 1.6 , 1.6 ) T 此时计算x在\hat w向量上的投影向量为\hat x=((\sqrt{1.2^2+2^2}*(cos(tan^{-1}(\frac{2}{1.2})-45))*cos45,\\(\sqrt{1.2^2+2^2}*(cos(tan^{-1}(\frac{2}{1.2})-45))*sin45)^T=(1.6,1.6)^T xw^x^=((1.22+22 (cos(tan1(1.22)45))cos45,(1.22+22 (cos(tan1(1.22)45))sin45)T=(1.6,1.6)T

∣ x ^ ∣ = 8 2 5 ≈ 2.2627 |\hat x|=\frac{8\sqrt{2}}{5}\approx2.2627 x^=582 2.2627

则 x 在 w ^ 方 向 上 的 投 影 为 ∣ x ^ ∣ ∣ w ^ ∣ = 12.8 = x T w ^ = w ^ T x 则x在\hat w方向上的投影为|\hat x||\hat w|=12.8=x^T\hat w=\hat w^Tx xw^x^w^=12.8=xTw^=w^Tx

如 此 推 广 到 w 方 向 上 , 可 得 到 上 述 命 题 如此推广到w方向上,可得到上述命题 广w

  • 未完待补充。。。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

猪里程

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值