通过lamda值来减小第三个参数和第四个参数的影响,参数接近于零,就相当于简化这个模型,比如下面的就变成了一个二次函数。 如果不知道=该缩小那个参数,就全部缩小 正则化实质:每次把参数缩小一点 正则化还可以避免不可逆操作