数学建模—分类模型

最新推荐文章于 2023-09-06 14:23:08 发布

Cocobol0

最新推荐文章于 2023-09-06 14:23:08 发布

阅读量1.9k

点赞数 11

分类专栏：数学建模文章标签：数学建模分类数据挖掘 matlab

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_73612682/article/details/132131155

版权

数学建模专栏收录该内容

17 篇文章 8 订阅

订阅专栏

本讲将介绍分类模型。对于而分类模型，我们将介绍逻辑回归（logistic regression）和Fisher线性判别分析两种分类算法；对于多分类模型，我们将简单介绍Spss中的多分类线性判别分析和多分类逻辑回归的操作步骤下。

本题按水果分类的例子

思路：逻辑回归原始现象

设置虚拟变量y
进行回归，估计出来的y-hat于虚拟变量中哪个更接近则分类为那个。

Eg：设1苹果，2橙子若y与1接近为苹果，与0近为橙子

数据预处理生成虚拟变量

自变量mass重量，width水果宽度，height水果高度，color_score颜色（0-1）

因变量：fruit_name水果名

生成虚拟变量操作：转换->创建虚拟变量

3.逻辑回归：

4.建立模型：

不难看出u与x有相关性所以存在内生性，导致得到的数据不准确，所以需要进行改进。

解决内生性的方法：两点分布

连接函数的取法

这两个公式由图得出两个模型都符合x属于（-∞，+∞）y属于（0，1）

如何求解？

将自变量代入式子得到y与0.5对比（本题按0.5对比是水果案例）

极大似然估计能够估计粗B_hat再推出y_hat最后预测。

怎么用于分类？

这里我们选择第二个方程e^X/1+e^x

SPSS求解二元逻辑回归：

逻辑回归系数表：

假如自变量有分类变量怎么办？

预测结果较差怎么办？

负面影响：

增加平方自变量过于让拟合线完全贴近样本数据，导致预测数据不吻合。

如何确定合适的模型？（既使得样本数据符合，也使得预测数据更加可靠）

这里我们把苹果和橙子都剔除三个再对比

Fisher线性判断别分析

核心问题：找到系数向量w

SPSS操作：

多分类问题：

Fisher判断多分类

1.设置好分类数量

2.摘要表

3.保存中：预测组成员+组员概率

Fisher多分类判别结果结果：

Logistic多分类判别：

Spss操作：

分析->回归->多元Logistic

统计中：选择分类其余可看自己是否需要选择

保存中选择：估算响应概率，预测类。

结果：

课后作业：

解答：

为了方便能进行多元分类，我们需要自定义类别的名称，如将变色鸢尾为1，山鸢尾为2，维吉尼亚鸢尾为3.

博主选择了Logistic多元分类：

但是为了防止样本数据或预测数据的不准确性，我们将数据分为训练组和测试组，最后得到的分类结果。

预测结果：

关注

11
点赞
踩
11

收藏

觉得还不错? 一键收藏
打赏
6
评论
数学建模—分类模型

对于而分类模型，我们将介绍逻辑回归（logistic regression）和Fisher线性判别分析两种分类算法；对于多分类模型，我们将简单介绍Spss中的多分类线性判别分析和多分类逻辑回归的操作步骤下
复制链接

扫一扫

专栏目录

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Cocobol0 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。