整体思路: 损失函数: 其他感悟: 这种假定分布的就像假定班级成绩服从正态分布一样,因为用的多了发现这种假定的期望loss最少,所以这么假定: loss通常用|估计值-实际值|或者|估计值-实际值|^2,本文里用的是这个,其实际意义也非常明显: