由task1可知,可以由b,w绘制出一个二维图找出L(损失)最小的情况,但是这个函数无论怎么改变b,w都很接近真实值,所以这时需要一个更复杂的函数。
一、分段线性曲线
我们假设真实值为这段红线,我们想要让我们的估测值达到这段红线的效果。可以理解为:
这条红线=一个常数+若干条折线
0:对应红线的起点
1:让蓝线1的斜率与红线的a段相同,且拐点一致
2:让蓝线2的斜率与b段相同,且拐点一致
3:让蓝线3的斜率与c段相同,且拐点一致
所以,红线=0+1+2+3
1、写出蓝线的方程
通过调整c、b、w的值可以逼近各种形状的蓝色线
w:调整线的斜率
b:将线左右移动
c:改变线的高度
所以,红线等于:
考虑多天的预测值时,task1中的函数时
现在用上面更复杂的函数方式对他进行改写:
二、重新开始机器学习的三步
1、定义函数
2、定义损失
之前的损失是L(w,b),由于现在参数变多,用θ来统称所有的变量,所以这里定义的损失为L(θ)
3、找最优解(同task1一样)
找出一组θ让L最小
随机选一组θ,把每一个参数都去计算与L的微分,计算的结果集合起来组成向量,然后更新参数
一直重复操作,就可以引申到深度学习了