特别无奈 逻辑回归的损失函数为啥是交叉熵 我的另一篇博客:逻辑回归为什么使用对数损失函数 逻辑回归为啥不用平方损失 原因很简单:就是会出现梯度消失问题,至于为啥看下面的这个推导(我真是无语!),其他的真的没啥说的了