sanity check(合理性检查)
大数据量带来高计算代价,所以首先得确定,是不是大数据量有帮助?
检查Jcv 和 Jtrain 的学习曲线。
如果如左图,有高方差,则说明过拟合了,增加数据量有帮助;
如果如右图,增加数据量没有太大帮助。
![在这里插入图片描述](https://img-blog.csdnimg.cn/8fae722792954d8e88c47a99c01f65b0.png?x-oss-process=image/watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAemhhbmczNQ==,size_20,color_FFFFFF,t_70,g_se,x_16)
随机梯度下降法(Stochastic Gradient Descent)
普通的梯度下降,当m很大时,下面蓝色方框的计算会耗时很高。
![在这里插入图片描述](https://img-blog.csdnimg.cn/10ada2210f3244c3be3588b5f8e265c1.png?x-oss-process=image/watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAemhhbmczNQ==,size_20,color_FFFFFF,t_70,g_se,x_16)
普通的梯度下降,又称为batch gradient descent,每次都需要读取所有数据。
这里就引出了随机梯度下降法。
- 随机shuffle数据集</