【Sklearn】基于线性判别法的数据分类预测(Excel可直接替换数据)

本文介绍了线性判别分析(LDA)的基本原理,目标是寻找最佳投影方向以最大化类别间的差异并最小化类内方差。通过求解广义特征值问题找到最佳投影向量,并使用该方向进行数据分类。LDA模型的参数如solver、shrinkage和n_components等会影响模型性能。文章提供了模型应用的示例代码、文件结构和资源下载链接。
摘要由CSDN通过智能技术生成

【Sklearn】基于线性判别法的数据分类预测(Excel可直接替换数据)

1.模型原理

线性判别分析(Linear Discriminant Analysis,简称LDA)是一种经典的模式识别和分类方法,它的目标是找到一个投影,将数据投影到低维空间,使得不同类别的样本在投影后的空间中有最大的类别间距,同时最小化类内方差。

模型原理如下:

  1. 假设有d维的数据,分为K个类别。我们的目标是找到一个投影方向(一个长度为d的权重向量w),使得在这个方向上的投影可以最大化类别间的差异,最小化类内的方差。

  2. 定义类内散度矩阵(Within-Class Scatter Matrix)Sw和类间散度矩阵(Between-Class Scatter Matrix)Sb:

    • 类内散度矩阵Sw表示各个类别内部数据的分散程度,计算方法是每个类别的数据与其类别均值的差的协方差之和。
    • 类间散度矩阵Sb表示不同类别之间的数据分散程度,计算方法是各个类别均值与总体均值的差的协方差加权和。
  3. 我们要最大化一个投影方向的目标函数J(w),该目标函数定义为类间散度矩阵与类内散度矩阵的比值:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

敲代码两年半的练习生

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值