判别分析
判别分析 ( distinguish analysis)(一):距离判别_wamg潇潇的博客-CSDN博客
判别分析 ( distinguish analysis)(二):Fisher线性判别分析LDA_费希尔判别函数怎么比_wamg潇潇的博客-CSDN博客
判别分析 ( distinguish analysis)(三):Bayes 判别_bayes判别_wamg潇潇的博客-CSDN博客(例题matlab代码)
判别分析 ( distinguish analysis)(四):应用举例_判别分析的应用案例_wamg潇潇的博客-CSDN博客(例题matlab代码)
链接一
链接二
链接三
链接四
例题
介绍
判别分析(Discriminant Analysis)是一种统计分析方法,用于确定一组预测变量如何区分不同组别的目标变量。它的主要作用是通过建立一个分类模型,将样本数据分配到事先定义的不同类别中。
判别分析可以用于多种情况,包括但不限于以下几个方面:
1. 分类问题:判别分析可以用于将样本数据分为不同的类别,例如将顾客分为高价值和低价值客户,将疾病患者分为不同的病种等。
2. 特征选择:判别分析可以帮助确定最相关的预测变量,从而降低模型复杂度和计算成本。
3. 数据压缩:判别分析可以将多个相关的预测变量转化为少数几个无关的线性组合,从而减少数据维度。
使用判别分析的一般步骤如下:
1. 收集数据:收集包含预测变量和目标变量的样本数据。
2. 数据预处理:对数据进行清洗、缺失值处理、异常值处理等预处理步骤。
3. 划分训练集和测试集:将数据集划分为训练集和测试集,用于模型的训练和评估。
4. 模型建立:使用训练集数据建立判别分析模型。
5. 模型评估:使用测试集数据评估模型的预测性能。
6. 模型应用:将模型应用于新的未知数据,进行预测或分类。
判别分析的优点包括:
1. 简单易用:判别分析是一种直观且易于理解的方法,不需要复杂的数学背景。
2. 变量选择:判别分析可以帮助选择最相关的预测变量,减少冗余信息。
3. 多分类能力:判别分析可以处理多个类别的分类问题。
4. 可解释性:判别分析可以提供每个预测变量对分类结果的贡献程度,方便解释模型结果。
判别分析的缺点包括:
1. 对数据分布的假设:判别分析通常基于对数据分布的假设,如正态分布假设,如果数据不满足这些假设,可能导致模型效果下降。
2. 对异常值敏感:判别分析对异常值敏感,异常值可能对模型的分类结果产生较大影响。
3. 高维数据问题:当预测变量维度较高时,判别分析可能会面临计算复杂度和过拟合问题。
4. 类别不平衡问题:当不同类别的样本数量差异较大时,判别分析可能会对数量较多的类别更为敏感,导致分类结果偏向数量较多的类别。
总体而言,判别分析是一种简单有效的分类方法,适用于许多实际问题。但在使用时需要注意数据的分布假设、异常值处理和类别不平衡等问题,以提高模型的准确性和稳定性。
一、Mahalanobis 距离
1、
2、
3、距离判别准则(链接一)
4、距离判别函数与标准(链接一)
二、Fisher判别
三、bayes判别
1.误判概率与误判损失
设有两个总体 X1和 X2 ,根据某一个判别规则,将实际上为 X1的个体判为 X2 或者将实际上为 X2 的个体判为 X1 的概率就是误判概率,一个好的判别规则应该使误判概率最小。除此之外还有一个误判损失问题或者说误判产生的花费(cost)问题,如把 X1的个体误判到 X2 的损失比 X2 的个体误判到 X1 严重得多,则人们在作前一种判断时就要特别谨慎。譬如在药品检验中把有毒的样品判为无毒后果比无毒样品判为有毒严重得多,因此一个好的判别规则还必须使误判损失最小。
例题(附matlab代码)
四、例题