[Machine Learning] 逻辑回归(Logistics Regression)

引言


Logistics回归,虽然这个算法从名字上来看是回归算法,但实际上是一个分类算法

Logistics回归是在线性回归的基础上,使用sigmoid函数,将线性模型 ω x + b \omega x+b ωx+b的结果压缩到 [ 0 , 1 ] [0,1] [0,1]之间,使其有概率意义

Logistics回归本质仍然是一个线性模型,虽然在线性模型 ω x + b \omega x+b ωx+b的基础上加入sigmoid函数后使其非线性化,但是这个非线性化的作用只是为了分类(Classification),并非为了将样本数据进行特征变换(Feature Transformation),因此,Logistics只能解决线性可分的问题。

Logistics回归属于概率性判别式模型,即:

思维引导


以下内容涉及贝叶斯公式、后验概率等内容,想具体了解可参考《[Machine Learning] 贝叶斯公式 & 全概率公式(Bayes Rule & Total Probability Theorem)》一文

一般来说,分类算法都是求解 p ( C k ∣ x ) p(C_k|x) p(Ckx),即对于一个新的样本,计算其条件概率 p ( C k ∣ x ) p(C_k|x) p(Ckx)。这个可以看作是一个后验概率,其计算可以基于贝叶斯公式得到:

p ( C k ∣ x ) = p ( x ∣ C k ) p ( C k ) ∑ k = 1 K p ( x ∣ C k ) p ( C k ) p(C_k|x) = \frac{p(x|C_k)p(C_k)}{\sum_{k=1}^Kp(x|C_k)p(C_k)} p(Ckx)=k=1Kp(xCk)p(Ck)p(xCk)p(Ck)

其中 p ( x ∣ C k ) p(x|C_k) p(xCk)是类条件概率密度, p ( C k ) p(C_k) p(Ck)是类的先验概率。使用这种方法的模型,称为是生成模型,即: p ( C k ∣ x ) p(C_k|x) p(Ckx)是由 p ( x ∣ C k ) p(x|C_k) p(xCk) p ( C k ) p(C_k) p(Ck)生成的。

尝试生成模型做分类


如果有n个特征数为m的样本数据(已分为两类),即:

( ( X 1 , y 1 ) , ( X 2 , y 2 ) , . . . , ( X n , y n ) ) ((X^1,y^1),(X^2,y^2),...,(X^n,y^n)) ((X1,y1),(X2,y2),...,(Xn,yn))

其中 X i = ( x 1 i , x 2 i , . . . , x m i ) ( i = 1 , 2 , . . . , n ) X^i = (x^i_1,x^i_2,...,x^i_m)(i = 1,2,...,n) Xi=(x1i,x2i,...,xmi)(i=1,2,...,n) y i ∈ { 0 , 1 } y^i\in \{0,1\} yi{ 0,1}

现在出现了一个新的样本 X X X,让你判断这个 X X X属于哪一类?(0还是1)

如果我们用生成模型的话,假设CLass 1代表1类,Class 2代表0类,由贝叶斯公式:

p ( C 1 ∣ x ) = p ( x ∣ C 1 ) p ( C 1 ) p ( x ∣ C 1 ) p ( C 1 ) + p ( x ∣ C 2 ) p ( C 2 ) p(C_1|x) = \frac{p(x|C_1)p(C_1)}{p(x|C_1)p(C_1)+p(x|C_2)p(C_2)} p(C1x)=p(xC1)p(C1)+p(xC2)p(C2)p(xC1)p(C1)

其实这个上面的这个式子,我们可以试着推导一下,即:

其中, z = l n P ( x ∣ C 1 ) P ( C 1 ) P ( x ∣ C 2 ) P ( C 2 ) z =ln \frac{P(x|C_1)P(C_1)}{P(x|C_2)P(C_2)} z=lnP(xC2)P(C2)P(xC1)P(C1),突然发现,我们一不小心推导出了一个sigmoid函数,但是我们先不管,我们继续用生成模型

那么现在我们只要确定了 z z z中的 P ( x ∣ C 1 ) 、 P ( x ∣ C 2 ) 、 P ( C 1 ) 、 P ( C 2 ) P(x|C_1)、P(x|C_2)、P(C_1)、P(C_2) P(xC1)P(xC2)P(C1)P(C2),我们就可以确定后验概率 p ( C 1 ∣ x ) p(C_1|x) p(C1x)

假设Class 1的数量为 N 1 N_1 N1,Class_2的数量为 N 2

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值