【10】 数学建模 | 分类模型 | 逻辑回归和Fisher判别分析

在这里插入图片描述

一、前言

这篇文章复盘分类模型。对于二分类模型,本文介绍逻辑回归和Fisher线性判别分析两种分类算法;对于多分类模型,我们将简单介绍Spss中的多分类线性判别分析和多分类逻辑回归的操作步骤

利用spass软件对数据进行预处理:生成虚拟变量

1.生成虚拟变量
在这里插入图片描述
2.删除多余虚拟变量
在这里插入图片描述
3.修改虚拟变量的名称
在这里插入图片描述

二、逻辑回归的原理

从宏观上分析,逻辑回归就是在原来回归思想上,添加了一个连接函数

问题分析的角度:对于因变量为分类变量的情况,可以使用逻辑回归来进行处理,即把y看成是事件发生的概率,y >= 0.5 表示事件发生; y <= 0.5表示事件不发生

2.1线性概率模型

直接用原来的回归模型进行归回分析

回归形式:
在这里插入图片描述
模型问题一:内生性问题
在这里插入图片描述
模型问题二:预测值不现实问题
在这里插入图片描述

2.2连接函数

用两点分布(伯努利分布)介绍连接函数的概念
在这里插入图片描述

2.3回归模型中连接函数的取法

回归模型中连接函数应该满足的条件:
在这里插入图片描述
连接函数取法一:可以取为标准正态分布的累积密度函数(一般用于Probit定序回归问题)
在这里插入图片描述
连接函数取法二:可以取为Sigmoid函数(一般用于逻辑回归问题)
在这里插入图片描述

2.4两种连接函数的图像对比

MATLAB代码:

f1=@(x) normcdf(x);  % 标准正态分布的累积密度函数 
fplot(f1, [-4,4]);  %-44上画出函数f1的图形
hold on;  % 不关闭作图窗口
grid on;   % 显示网格线
f2=@(x) exp(x)/(1+exp(x));  % Sigmoid函数
fplot(f2, [-4,4]);  %-44上画出函数f2的图形
legend('标准正态分布的cdf','sigmoid函数','location','SouthEast')

图像:

在这里插入图片描述

2.5连接函数的求解

对于线性函数的参数的求解一般用最小二乘法,对于非线性函数的参数求解一般用极大似然法进行估计

推导过程:
在这里插入图片描述
2.6具体逻辑回归分析
在这里插入图片描述

三、用spass实现逻辑回归

具体操作:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
回归结果:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3.1 分类变量的处理办法
  • 先创建虚拟变量,然后删除任意一列以排除完全多重共线性的影响
  • 二元回归中直接点击分类选项,然后定义分类协变量,Spss会自动帮我们生成(推荐)
3.2 预测效果差的解决办法

在逻辑回归的因变量中添加平方项、交互项等

在这里插入图片描述

3.3 过拟合现象

虽然预测能力提高了,但是容易发生过拟合的现象。对于样本数据的预测非常好,但是对于样本外的数据的预测效果可能会很差
在这里插入图片描述

3.4 如何选择模型,防止过拟合

把数据分为训练组和测试组,用训练组的数据来估计出模型,再用测试组的数据来进行测试。(训练组和测试组的比例一般设置为80%和20%)

注意:为了消除偶然性的影响,可以对上述步骤多重复几次,最终对每个模型求一个平均的准确率,这个步骤称为交叉验证

四、Fisher线性判别分析

Fisher判别分析,该方法思想比较简单:给定训练集样例,设法将样例投影到一维的直线上,使得同类样例的投影点尽可能接近和密集,异类投影点尽可能远离
在这里插入图片描述

利用spass具体实现

在这里插入图片描述
结果分析
在这里插入图片描述


五、多分类问题

在这里插入图片描述
说明:数据集的获取,关注微信公众号,回复“分类模型”即可

  1. 利用Fisher判别分析解决多分类问题
    在这里插入图片描述
    在这里插入图片描述
    注意:这里SPSS不能自动帮我们生成虚拟变量,我们可以在EXCEL表中使用“替换”功能来快速生成虚拟变量(kind)

结果:
在这里插入图片描述
2. 利用逻辑回归解决多分类问题

将二元逻辑回归中的连接函数:Sigmoid函数推广为Softmax函数即可

利用spass实现:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
多分类结果
在这里插入图片描述
分析:预测结果非常准确,要注意过拟合现象


更多有关于分类问题的经典获奖论文,关注公众号,回复,“分类模型”,即可免费领取!!!
在这里插入图片描述

  • 5
    点赞
  • 38
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
fisher线性判别分析Fisher's Linear Discriminant Analysis,简称FLDA)和逻辑回归(Logistic Regression)都是常见的分类算法,它们有一些区别和联系。 首先,FLDA是一种有监督的线性降维方法,其目的是将高维特征空间中的数据映射到低维空间,以实现分类的目的。它假设不同类别的数据具有相同的协方差矩阵,并试图找到一个投影向量,使得同一类别的样本尽可能接近,不同类别的样本尽可能分开。 相比之下,逻辑回归是一种分类算法,其基本思想是通过一个线性回归模型来估计不同类别的条件概率,并利用逻辑函数(如sigmoid函数)将概率映射到0-1之间,从而实现分类。 FLDA和逻辑回归在应用上的区别主要体现在以下几方面: 1. 假设条件不同:FLDA假设不同类别的数据具有相同的协方差矩阵,而逻辑回归没有这个假设。 2. 类别数目不同:FLDA适用于多分类问题,可以将数据映射到维度为类别数目-1的空间中,而逻辑回归一般适用于二分类问题。 3. 输出形式不同:FLDA输出的是一个线性判别函数的值,用于判断样本的类别,而逻辑回归输出的是样本属于某一类别的概率。 此外,FLDA和逻辑回归也存在一些联系: 1. FLDA可以被看作是逻辑回归的特例之一,当输入样本是高斯分布时,FLDA与逻辑回归具有相同的分类结果。 2. 逻辑回归可以使用FLDA降维的结果作为输入特征,从而进一步提高分类性能。 综上所述,FLDA和逻辑回归虽然有一些区别和联系,但都是常见的分类算法,具有各自的优势和适用场景。在实际应用中,选取合适的算法需要根据具体的问题和数据特征来进行权衡和选择。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值