逻辑回归中
假设函数
h
θ
(
x
)
~h_\theta(x)~
hθ(x) 输出的是给定
x
~x~
x 和参数
θ
\theta
θ时,
y
=
1
~y=1~
y=1 的估计概率,即:
h
θ
(
x
)
=
g
(
θ
T
x
)
=
p
(
y
=
1
∣
x
;
θ
)
~~~~~~~~~~~~~~~~~~~h_\theta(x)=g(\theta^Tx)=p(y=1|x;\theta)
hθ(x)=g(θTx)=p(y=1∣x;θ)
g
(
z
)
=
1
1
+
e
−
z
~~~~~~~~~~~~~~~~~~~~~g(z)=\frac{1}{1+e^{-z}}
g(z)=1+e−z1
当我们想知道预测值 y=1 还是 y=0 时,可以这样做:
预
测
值
为
y
=
1
时
条
件
为
h
θ
(
x
)
=
g
(
θ
T
x
)
≥
0.5
预测值为 y=1 时 ~~~~~~~~~~~~~~~~~~~~~条件为~~~h_\theta(x)=g(\theta^Tx)\geq0.5
预测值为y=1时 条件为 hθ(x)=g(θTx)≥0.5
预
测
值
为
y
=
0
时
条
件
为
h
θ
(
x
)
=
g
(
θ
T
x
)
<
0.5
预测值为 y=0 时 ~~~~~~~~~~~~~~~~~~~~~条件为~~~h_\theta(x)=g(\theta^Tx)<0.5
预测值为y=0时 条件为 hθ(x)=g(θTx)<0.5
这样我们就可以更好的理解逻辑回归的假设函数是如何做出预测的。
例
假设如上图中有两类数据,假设函数为
h
θ
(
x
)
=
g
(
θ
0
+
θ
1
x
1
+
θ
2
x
2
)
~h_\theta(x)=g(\theta_0+\theta_1x_1+\theta_2x_2)~
hθ(x)=g(θ0+θ1x1+θ2x2) ,此时我们拟合好的的参数为[-3, 1, 1],现在对预测值进行计算:
预
测
值
y
=
1
条
件
:
θ
T
x
≥
0
~~~~~~~~~~~~预测值~~~y=1~~~~~~~~~~~~~~~条件:~~~~~~~~~~~~~~~~~~~~\theta^Tx\geq0
预测值 y=1 条件: θTx≥0
即
−
3
+
x
1
+
x
2
≥
0
~~~~~~~~~~~~即~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~-3+x_1+x_2\geq0
即 −3+x1+x2≥0
x
1
+
x
2
≥
3
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~x_1+x_2\geq3
x1+x2≥3
预
测
值
y
=
0
条
件
:
θ
T
x
<
0
~~~~~~~~~~~~预测值~~~y=0~~~~~~~~~~~~~~~条件:~~~~~~~~~~~~~~~~~~~~\theta^Tx<0
预测值 y=0 条件: θTx<0
即
−
3
+
x
1
+
x
2
<
0
~~~~~~~~~~~~即~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~-3+x_1+x_2<0
即 −3+x1+x2<0
x
1
+
x
2
<
3
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~x_1+x_2<3
x1+x2<3
下图是进行决策化后的图象:
而 x 1 + x 2 = 3 ~x_1+x_2=3~ x1+x2=3 对应 h θ ( x ) ~h_\theta(x)~ hθ(x) 正好等于0.5的区域,决策界限也就是这条直线。决策界限时假设函数的属性,决定于基参数 θ ~\theta~ θ ,不是数据集的属性。