引出
线性回归+阈值会有一定问题,因此需要把值映射到某个范围内,sigmoid函数
11+e−z
1
1
+
e
−
z
当预测出来的结果,可以看成概率p<0.5,y=0;如果p>0.5,y=1
损失函数,代价函数
如果逻辑回归采用的代价函数和线性回归使用同样的损失函数,平方损失,在逻辑回归的假设函数条件下,损失函数是非凸函数,因此逻辑回归的损失函数为:
Cost(hΘ(x),y)=−log(hΘ(x))ify=1
C
o
s
t
(
h
Θ
(
x
)
,
y
)
=
−
l
o
g
(
h
Θ
(
x
)
)
i
f
y
=
1
Cost(hΘ(x),y)=−log(1−hΘ(x))ify=0
C
o
s
t
(
h
Θ
(
x
)
,
y
)
=
−
l
o
g
(
1
−
h
Θ
(
x
)
)
i
f
y
=
0
- 这个损失函数合理性
- 如果y=1,希望 hΘ h Θ 越接近1越好,如果 hΘ h Θ 接近1,那么 log(hΘ(x)) l o g ( h Θ ( x ) ) 接近0
- 如果 y=0,希望 hΘ h Θ 越接近0越好,如果 hΘ h Θ 接近0,那么 log(1−hΘ(x)) l o g ( 1 − h Θ ( x ) ) 接近0
- log函数在(0,1)内,正常是负数
逻辑回归的损失函数
把每个样本的损失加起来求和,然后求平均损失最小
J(Θ)=1m∑i=1mCost(hΘ(x(i)),y(i))
J
(
Θ
)
=
1
m
∑
i
=
1
m
C
o
s
t
(
h
Θ
(
x
(
i
)
)
,
y
(
i
)
)
J(Θ)=−1m[∑i=1my(i)loghΘ(x(i))+(1−y(i))log(1−hΘ(x(i))]+λ2m∑j=1nΘ2j
J
(
Θ
)
=
−
1
m
[
∑
i
=
1
m
y
(
i
)
l
o
g
h
Θ
(
x
(
i
)
)
+
(
1
−
y
(
i
)
)
l
o
g
(
1
−
h
Θ
(
x
(
i
)
)
]
+
λ
2
m
∑
j
=
1
n
Θ
j
2
- 为了使决策边界的曲线不会太弯曲,需要添加正则化项