Logistic 损失函数
1.Logistic函数 & Logistic回归
Logistic函数的定义:
P(x)=11+exp(−x)(1)
其中 x∈ℝ , P(x)∈ℝ 。Logistic函数的一个重要的特点:
P(−x)=1−P(x)(2)
Logistic函数常用语Logistic回归:
P(y=1∣βx)=exp(βTx)1+exp(βTx)
P(y=0∣β,x)=11+exp(βTx)(3)
其中
x
是特征向量
P(y=1∣βx)=1−P(y=0∣β,x)(4)
在Logistics回归中,标签
y∈{0,1}
。式子(3)用两个表达式来建模,也能够用一个表达式来建模:
P(g=±1∣β,x)=11+exp(−gβTx)(5)
其中 g∈±1 是样本点 x 的标签。很容易证明
2. 两种Logistic回归形式的等价性
上述式(3)和(5)描述了Logistics回归的两种形式,这一节证明两中形式是等价的:
P(y=1∣β,x)=exp(βTx)1+exp(βTx)=11exp(βTx)+1=1exp(−βTx)+1=P(g=1∣β,x)
从分类机制证明(3),类标签为1的概率大于类标签为0的概率:
exp(βTx)1+exp(βTx)11+exp(βTx)exp(βTx)βTx>1→y=1>1>0
从分类机制证明(5),类标签为1的概率大于类标签为-1的概率:
11+exp(−βTx)11+exp(βTx)1+exp(βTx)1+exp(−βTx)exp(βTx)βTx>1→g=1>1>1>0
3. Logistic损失
描述Logistics回归的优化形式:
argmin∑iL(yi,f(xi))
其中 f 是一个假想函数(hypothesis function),
f(x)L(y,f(x))=βTx=log(1+exp(−yf(x)))
其中 y∈{±1} 。