统计学习基础--第四章 分类

本文深入介绍了逻辑斯谛回归(logistic)和线性判别分析(LDA),包括概率模型、估计回归系数、贝叶斯判别分析以及分类器评价指标如AUC和ROC曲线。内容涵盖了单变量和多元逻辑斯谛回归,以及p=1和p>1的线性判别分析,并探讨了不同分类方法的优缺点。
摘要由CSDN通过智能技术生成

目录

一、逻辑斯谛回归(logistic)

1、Logistic模型

(1)概率

(2)逻辑斯谛函数

(3)注意

2、估计回归系数

(1)方法:极大似然估计

(2)似然函数

(3)预测

(4)多元逻辑斯谛回归

二、线性判别分析(LDA)

1、贝叶斯判别分析

2、p=1的线性判别分析

(1)p=1:只有一个预测变量

(2)思路

(3)假设

(4)参数估计 

3、 p>1的线性判别分析

4、二次判别分析(QDA)

三、分类器评价指标

1、灵敏度、特异度

2、ROC曲线

3、AUC

 4、为什么使用ROC和AUC评价分类器?

四、分类方法的比较


常见的分类方法有:逻辑斯谛回归(logistic)、线性判别分析(LDA)和K最近邻(KNN)。

一、逻辑斯谛回归(logistic)

逻辑斯谛回归对Y属于某一类的概率建模而不直接对响应变量建模。

1、Logistic模型

(1)概率

P(X)=P_r(Y=1|X)

(2)逻辑斯谛函数

\small p(X)=\frac{e^{\beta_0+\beta_1X}}{1+e^{\beta_0+\beta_1X}}\Rightarrow e^{\beta_0+\beta_1X}=\frac{p(X)}{1-p(X)}\Rightarrow log(\frac{p(X)}{1-p(X)})=\beta_0+\beta_1X

其中,p(X)/[1-p(X)]的值称为发生比,取值范围为0到∞,其值接近于0表示违约概率非常低,接近于∞则表示违约概率非常高。对数变化后,等式左边为对数发生比或分对数,即逻辑斯谛回归模型为分对数变换下关于X的一个线性模型。

(3)注意

  • 在逻辑斯谛回归模型中,X每增加一个单位,对数发生比的变化为β1,发生比的变化乘以\small e^{\beta_1};
  • 当β1>0时,P(X)随X的增加而增加;当β1<0时,P(X)随X的增加而减少。

2、估计回归系数

(1)方法:极大似然估计

(2)似然函数

\small l(\beta_0,\beta_1)=\prod_{i:y_i=1} p(x_i)\prod_{i':y_{i'}=0} (1-p(x_{i'}))\Rightarrow lnl(\beta_0,\beta_1)=\sum_{i=1}^nln(p(x_i))+\sum_{i=1}^nln(1-p(x_i))

 对数变换将连乘转化为累加求和,便于计算。

(3)预测

\small \hat{p}(X)=\frac{e^{\beta_0+\beta_1X}}{1+e^{\beta_0+\beta_1X}}

(4)多元逻辑斯谛回归

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值