数学建模之判别分析

判别分析

判别分析 ( distinguish analysis)(一):距离判别_wamg潇潇的博客-CSDN博客

判别分析 ( distinguish analysis)(二):Fisher线性判别分析LDA_费希尔判别函数怎么比_wamg潇潇的博客-CSDN博客

判别分析 ( distinguish analysis)(三):Bayes 判别_bayes判别_wamg潇潇的博客-CSDN博客(例题matlab代码)

判别分析 ( distinguish analysis)(四):应用举例_判别分析的应用案例_wamg潇潇的博客-CSDN博客(例题matlab代码)

链接一

1.Mahalanobis 距离的概念

2 Mahalanobis 距离(马氏距离)的定义

2.距离判别的判别准则

 3 两总体距离的判别函数

4 待测样本的判别函数与判别准则 

链接二

Fisher 线性判别函数

Fisher 判别规则

链接三

1.误判概率与误判损失

 平均误判损失ECM

 2.两总体的 Bayes 判别

 Anderson 线性判别函数

例:建立 Anderson 线性判别函数

链接四

例题

介绍

判别分析(Discriminant Analysis)是一种统计分析方法,用于确定一组预测变量如何区分不同组别的目标变量。它的主要作用是通过建立一个分类模型,将样本数据分配到事先定义的不同类别中。

判别分析可以用于多种情况,包括但不限于以下几个方面:

1. 分类问题:判别分析可以用于将样本数据分为不同的类别,例如将顾客分为高价值和低价值客户,将疾病患者分为不同的病种等。

2. 特征选择:判别分析可以帮助确定最相关的预测变量,从而降低模型复杂度和计算成本。

3. 数据压缩:判别分析可以将多个相关的预测变量转化为少数几个无关的线性组合,从而减少数据维度。

使用判别分析的一般步骤如下:

1. 收集数据:收集包含预测变量和目标变量的样本数据。

2. 数据预处理:对数据进行清洗、缺失值处理、异常值处理等预处理步骤。

3. 划分训练集和测试集:将数据集划分为训练集和测试集,用于模型的训练和评估。

4. 模型建立:使用训练集数据建立判别分析模型。

5. 模型评估:使用测试集数据评估模型的预测性能。

6. 模型应用:将模型应用于新的未知数据,进行预测或分类。

判别分析的优点包括:

1. 简单易用:判别分析是一种直观且易于理解的方法,不需要复杂的数学背景。

2. 变量选择:判别分析可以帮助选择最相关的预测变量,减少冗余信息。

3. 多分类能力:判别分析可以处理多个类别的分类问题。

4. 可解释性:判别分析可以提供每个预测变量对分类结果的贡献程度,方便解释模型结果。

判别分析的缺点包括:

1. 对数据分布的假设:判别分析通常基于对数据分布的假设,如正态分布假设,如果数据不满足这些假设,可能导致模型效果下降。

2. 对异常值敏感:判别分析对异常值敏感,异常值可能对模型的分类结果产生较大影响。

3. 高维数据问题:当预测变量维度较高时,判别分析可能会面临计算复杂度和过拟合问题。

4. 类别不平衡问题:当不同类别的样本数量差异较大时,判别分析可能会对数量较多的类别更为敏感,导致分类结果偏向数量较多的类别。

总体而言,判别分析是一种简单有效的分类方法,适用于许多实际问题。但在使用时需要注意数据的分布假设、异常值处理和类别不平衡等问题,以提高模型的准确性和稳定性。

一、Mahalanobis 距离

1、

2、

3、距离判别准则(链接一)

4、距离判别函数与标准(链接一)

二、Fisher判别

三、bayes判别

1.误判概率与误判损失

设有两个总体 X1和 X2 ,根据某一个判别规则,将实际上为 X1的个体判为 X2 或者将实际上为 X2 的个体判为 X1 的概率就是误判概率,一个好的判别规则应该使误判概率最小。除此之外还有一个误判损失问题或者说误判产生的花费(cost)问题,如把  X1的个体误判到 X2 的损失比 X2 的个体误判到 X1 严重得多,则人们在作前一种判断时就要特别谨慎。譬如在药品检验中把有毒的样品判为无毒后果比无毒样品判为有毒严重得多,因此一个好的判别规则还必须使误判损失最小。

例题(附matlab代码)

四、例题

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
在MATLAB中进行数学建模时,数据预处理是一个非常重要的步骤,它可以帮助我们清洗、转换和准备数据,以便后续的分析和建模。下面是一些常见的MATLAB数据预处理技术: 1. 数据清洗:数据清洗是指处理数据中的异常值、缺失值和重复值等问题。在MATLAB中,可以使用函数如`isnan`、`isoutlier`和`unique`来检测和处理这些问题。 2. 数据转换:数据转换是指将原始数据转换为适合建模和分析的形式。常见的数据转换方包括标准化、归一化、对数转换和平滑等。在MATLAB中,可以使用函数如`zscore`、`normalize`和`log`来进行这些转换。 3. 特征选择:特征选择是指从原始数据中选择最相关或最具有代表性的特征。在MATLAB中,可以使用特征选择算如相关系数、方差分析和主成分分析等来进行特征选择。 4. 数据降维:数据降维是指将高维数据转换为低维表示,以减少数据的复杂性和存储空间。常见的数据降维方包括主成分分析(PCA)和线性判别分析(LDA)。在MATLAB中,可以使用函数如`pca`和`lda`来进行数据降维。 5. 数据平衡:数据平衡是指处理不平衡数据集中类别不均衡的问题。在MATLAB中,可以使用函数如`undersample`和`oversample`来平衡数据集中的类别。 以上是MATLAB中常见的数据预处理技术,它们可以帮助我们提高数据的质量和准确性,从而更好地进行数学建模和分析。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值