李宏毅机器学习特训营*PaddlePaddle小白初探课节二-2_基于paddle的机器学习课程实验案例-CSDN博客

本文链接：https://blog.csdn.net/qq_45567486/article/details/114776620

在智能车竞赛卓晴老师的公众号中了解到 paddlepaddle，因自己的竞赛组别也涉及到机器学习故前来取经，也算是想对自己点亮个技能点，努力奋斗吧~
在此记录，以共同学习并以此监督自己的探索之旅~
课程链接： 百度AI Studio李宏毅课程-机器学习

课节二-2—1 回归-演示

这一课为实践课，老师向我们展示了一个“简单的”用gradient descent 找系数的regression模型（确实看起来挺简单虽然我也看不太懂，，具体我遇到的小白问题会再开一篇文章的），其中应对几个问题老师也在实操中给出了解释
一共不到二十行的代码，具体的名词解释上两课都有说到

A： Learning rate 不够大

A：“放个大绝”给b和w客制化的learning rate : AdaGrad

Ir_b = lr_b + b_grad ** 2
lr_w = Ir_w + w_grad ** 2
#Update parameters.
b = b -  lr/np.sqrt(lr_b) * b_grad
w = w - lr/np.sqrt(lr_w) * w_grad

通过对error来源的分析有方向性的improve model
error的两种来源：bias 和variance

机率例子
（首先我是没学过机率的，，
这一段看了几遍最后我的理解就是：

说如果想要求mean(算数中项?)的话，随机取几个点求平均数的方式并不会exactly得到mean，这时候如果说我们对各个平均数(即图中的m)求一下期望E[m] , 可得出μ
m 这个estimator (方差)因为期望正好等于μ 所以说是unbiased (不偏不倚的), 对于m_x 散布的范围取决于m 的variance (Var[m]) , 其值取决于取了多少的sample, 那个公式用就完了, 从课本上来的