LR算法 1、公式推导 1、线性回归加上sigmod函数进行归一化到0-1之间 2、损失函数采用交叉熵(极大似然函数)1/m * [-ylog§ - (1-y)log(1-p)] 2、损失函数为什么不MSE 1、非凸函数,因为求二阶导数并不是大于0,在2/3处等于0 2、梯度消失,MSE损失函数求导数出现了sigmod的倒数:h*(1-h),在0或者1处会出现梯度消失