嘻嘻嘻,终于到这一章~
自动去找到拟合参数简直太棒了好嘛> w <
Logistics Regression:包括Gradient Regression和Stochastic Regression。
优点:计算代价不高
缺点:容易欠拟合,分类精度可能不高
适用于数值型和标称型
在这里,我们需要的函数是,接受所有的输入然后预测出类别。例如,在两个分类情况,输出0或1,这一的函数称为Heaviside step function,即单位阶跃函数。这个函数的问题在于:瞬间跳跃过程有时很难处理,于是需要和数学上的sigmoid函数一起合并。
sigmoid函数:
当x为0,sigmoid函数值为0.5。随着x增大,对应的sigmoid值趋近1,随着x减小,sigmoid值趋近0。当横坐标足够大,sigmoid函数看起来像是一个阶跃函数。
所以结合logistics regress和sigmoid得到solution是:每个特征都乘以一个回归系数,把结果总和代入sigmoid函数中,得到一个0~1范围的数值。
sigmoid函数的输入为z:
也就是
P1:Gradient Regression
找到某个函数的最大值(最小值),最好的方法是沿着函数的梯度方向去找。
函数f(x, y)的梯度▽函数为:
这个梯度意味沿着x的方向移动,沿着y的方向移动
,其中函数f(x, y)必须要在待计算的点上有定义并且可微。
梯度的方向就是导数最大值的方向,即函数变化率最高的方向。因此,梯度方向可以通过对函数求导得到。
梯度算法一直迭代执行,在每个点会重新计算移动的方向,直到达到某个停止条件位置,比如迭代次数达到某个指定值,或者算法达到某个范围。迭代公式:
梯度上升: