一、逻辑回归
1、主要思想:
(1)对于离散的分类问题,根据数据对分类边界线(Decision Boundary)建立回归公式,以此进行分类。
(2)逻辑回归本质上是广义的线性回归 g ( x ) = θ 0 x 0 + θ 1 x 1 + θ 2 x 2 + . . . + θ n x n g( x) \ =\theta _{0} x\ _{0} \ +\ \theta _{1} x\ _{1} \ +\ \theta _{2} x\ _{2} \ +...+\theta _{n} x\ _{n} g(x) =θ0x 0 + θ1x 1 + θ2x 2 +...+θnx n,再加上一个sigmoid函数。单纯使用线性回归+阈值,当遇到噪音较大时,会导致预测严重不准,因此引入sigmoid函数。
(3)例如,2分类问题, g ( x ) g( x) g(x)>0属于正类, f ( x ) f( x) f(x)<0属于负类。经过sigmoid函数, g ( x ) g( x) g(x)从正负无穷压缩到0-1之间,大于0.5为正类,小于等于0.5为负类。
2、sigmoid函数
sigmoid公式:
h ( x ) = 1 1 + e − x h(x)\ =\frac{1}{1+e^{-x}} h(x) =1+e−x1
线性回归+sigmoid变换公式:
g ( x ) = θ 0 x 0 + θ 1 x 1 + θ 2 x 2 + . . . + θ n x n g( x) \ =\theta _{0} x\ _{0} \ +\ \theta _{1} x\ _{1} \ +\ \theta _{2} x\ _{2} \ +...+\theta _{n} x\ _{n} g(x) =θ0x 0 + θ1x 1 + θ2x 2 +...+θ