清风数学建模笔记——分类模型

最新推荐文章于 2024-02-29 14:55:40 发布

我喜欢的猫呢

最新推荐文章于 2024-02-29 14:55:40 发布

阅读量559

点赞数

分类专栏：数学建模文章标签：分类逻辑回归

本文链接：https://blog.csdn.net/weixin_56707534/article/details/128732008

版权

数学建模专栏收录该内容

3 篇文章 1 订阅

订阅专栏

二分类（逻辑回归+fisher线性判别）与多分类模型

引例

数据预处理

由于水果类别是文字信息，所以要将定性数据转化成0-1变量
SPSS操作：

逻辑回归本质还是回归分析的一种，对于因变量为分类变量的情况，我们可以把y看成事件发生的概率， $y\ge0.5$ 表示发生； $y\lt0.5$ 表示不发生。

逻辑回归

线性概率模型

$y_{i}=\beta_{0}+\beta_{1} x_{1 i}+\beta_{2} x_{2 i}+\cdots+\beta_{k} x_{k i}+\mu_{i}$
写成向量乘积形式(简写一下):
$y_{i}=\boldsymbol{x}_{\boldsymbol{i}}^{\prime} \boldsymbol{\beta}+u_{i}(i=1,2, \cdots, n)$

问题一：
内生性（看扰动项与自变量是否相关）： $y_{0}$ 只能取1或者0

$u_{i}=\left\{\begin{array}{cc} 1-\boldsymbol{x}_{\boldsymbol{i}}^{\prime} \boldsymbol{\beta} & , y_{i}=1 \\ -\boldsymbol{x}_{\boldsymbol{i}}^{\prime} \boldsymbol{\beta} & , y_{i}=0 \end{array}\right.$
显然 $\operatorname{cov}(x_{i}, u_{i}) \neq 0$ ，因此会有内生性问题，就会导致回归系数估计出来不一致且有偏。

问题二：
由于把y看成事件发生的概率，但 $\widehat{y_{i}}=\widehat{\beta_{0}}+\widehat{\beta_{1}} x_{1 i}+\widehat{\beta_{2}} x_{2 i}+\cdots+\widehat{\beta_{k}} x_{k i}$ ，预测值可能出现 $\widehat{y_{i}}\gt1$ 或 $\widehat{y_{i}}\lt0$ 的不现实情况

解决方法

由于二分类，因此可以看成是伯努利分布。

事件	1	0
概率	p	1-p

在给定 $\boldsymbol{x}$ 的情况下，考虑y的情况如下：
$\left\{\begin{array}{l} P(y=1 \mid \boldsymbol{x})=F(\boldsymbol{x}, \boldsymbol{\beta}) \\ P(y=0 \mid \boldsymbol{x})=1-F(\boldsymbol{x}, \boldsymbol{\beta}) \end{array}\right.$
(一般 $F(\boldsymbol{x}, \boldsymbol{\beta})=F(\boldsymbol{x}_{\boldsymbol{i}}^{\prime} \boldsymbol{\beta})$ )

$F(\boldsymbol{x}, \boldsymbol{\beta})$ 被称为连接函数，只需要保证 $F(\boldsymbol{x}, \boldsymbol{\beta})$ 是定义在 $[0, 1]$ 上的函数（注意这里的 $[0, 1]$ 是值域)，就能保证 $\leq \hat{y} \leq 1$ 。
计算 $\mid \boldsymbol{x})$ 可知其等于 $\mid \boldsymbol{x})$ ，因此可以用 $\widehat{y_{i}}$ 来作为分类的依据。

连接函数的取法：
1.正态分布（probit回归）
2.Sigmoid函数（logistic回归）

一般用logistic回归，因为Sigmoid函数表示形式简单一点，有解析表达式，便于后续操作。
$F(\boldsymbol{x}, \boldsymbol{\beta})=S\left(\boldsymbol{x}_{\boldsymbol{i}}^{\prime} \boldsymbol{\beta}\right)=\frac{\exp \left(\boldsymbol{x}_{\boldsymbol{i}}^{\prime} \boldsymbol{\beta}\right)}{1+\exp \left(\boldsymbol{x}_{\boldsymbol{i}}^{\prime} \boldsymbol{\beta}\right)}$

操作说明

$\widehat{y_{i}}=P\left(y_{i}=1 \mid \boldsymbol{x}\right)=S\left(\boldsymbol{x}_{\boldsymbol{i}}^{\prime} \hat{\boldsymbol{\beta}}\right)=\frac{\exp \left(\boldsymbol{x}_{\boldsymbol{i}}^{\prime} \hat{\boldsymbol{\beta}}\right)}{1+\exp \left(\boldsymbol{x}_{\boldsymbol{i}}^{\prime} \hat{\boldsymbol{\beta}}\right)}=\frac{e^{\widehat{\beta_{0}}+\widehat{\beta}_{1} x_{1 i}+\widehat{\beta}_{2} x_{2 i}+\cdots+\widehat{\beta}_{k} x_{ki}}}{1+e^{\widehat{\beta}_{0}+\widehat{\beta}_{1} x_{1 i}+\widehat{\beta}_{2} x_{2 i}+\cdots+\widehat{\beta}_{k} x_{ki}}}$