参考https://zhuanlan.zhihu.com/ml-jack ;
简单过一遍,不推导公式;
1.Sigmoid函数(还有一些类似作用的函数Tan....)主要利用它的函数性质 值域在(0~1)
2.首先理解一下logsitic的主要干什么,主要是对现有的data做一个分割线,来完成分类。
3.分割线的位置就是参数的计算,就涉及到参数最优化;
4.下面的是目标函数(不是Loss function)
目标函数就是似然函数,求目标函数最大的过程就是最大似然估计的过程
5.最大似然的求解过程中用到了梯度下降法(参考的博主是使用的局部梯度最优化)吴恩达推导的是全局梯度最优化;
6.上面的区别 在于回归系数的更新速度,局部快点。
7.下面就是python 的代码。