在机器学习(逻辑回归)过程中遇到了代码问题,关于numpy.log()方法的数值错误:
return - np.sum(y*np.log(y_hat + 1e-5) + (1-y)*np.log(1-y_hat + 1e-5)) /len(y)
这是在用到逻辑回归时的损失函数J(theta),换做代码表示在Jupyter运行报错。
查阅原因后,问题是计算log后的数值太大了,导致数据溢出,因此需要做一下数据精度的处理,这里我们把改变了浮点数的精度为1e-6。
return - np.sum(y*np.log(y_hat + 1e-6) + (1-y)*np.log(1-y_hat+1e-6)) /len(y)
这次训练结果正确,训练完毕。