我们要知道实际应用中,我们给出一堆的数据,那么可能他的曲线并不是一个规则的,开口向上的,一个函数图形,很有可能我们求出的是一个局部的最优解,但是我们不要求,求出全局最优解,只要。可以看到对算是函数,求导,得到的XTX,这里自己乘以自己,所以肯定是平方,平方的话,那么一定是开口向上的,是有最优解的也就是说,梯度最小,也就是斜率最小是0.可以看到下面也是,各种X的导数,然后计算,得到对应的矩阵结果,这个知道就可以,到时候可以查,不用背.也就是希望,得到一个导数最底部的值,这样损失最小,概率最大,最集中.