数据分析学习总结笔记08：数据分类典型方法及其R语言实现

最新推荐文章于 2023-07-14 11:59:42 发布

Lynn Wen

最新推荐文章于 2023-07-14 11:59:42 发布

阅读量1.1k

点赞数 1

分类专栏：数据分析学习总结笔记文章标签：数据挖掘数据分析机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41961559/article/details/105287543

版权

本文介绍了数据分类的几种典型方法，包括判别分析中的距离判别法、Fisher判别法和Bayes判别法，并详细阐述了每种方法的原理、步骤和适用场景。此外，还探讨了Fisher判别法的R语言实现，以及logistic回归在数据分类中的应用。

摘要由CSDN通过智能技术生成

统计建模与数据挖掘中面对的三大重要问题：预测、分类和聚类。本文学习总结其中的分类问题，主要介绍判别分析方法和logistic回归，这两种方法在现实应用中也十分普遍。

1 判别分析

1.1 判别分析简介

1.1.1 判别分析概念

判别分析（Discriminat Analysis）是多元分析中用于判别样本所属类型的一种统计分析方法。

在已知的分类之下，对新的样本，可以利用此方法选定一判别标准，以判定将该新样品放置于哪个类中。
适用于数据集较小的情况，因为数据量够大的话神经网络的准确率会比传统的判别分析高得多
判别分析的用途甚多：医学疾病诊断、动植物分类、商品等级划分和商业银行客户评级等。

1.1.2 判别分析的种类

（1）确定性判别：Fisher型判别

线性型
距离型
非线性型

（2）概率性判别：Bayes型判别

概率型
损失型

1.2 距离判别法

1.2.1 两总体距离判别

设μ1，μ2，Σ1，Σ2分别为两个类G1，G2的均值向量和协方差阵。

马氏距离（欧式距离只考虑了样本中心点的位置，马氏距离不仅考虑了样本中心点的位置，还考虑了样本各个特征间的相互关系以及样本的度量）：
判别准则：

（1）等方差阵：直线判别

（2）异方差阵：曲线判别

1.2.2 多总体距离判别

与两总体距离判别类似：

首先假定k个类别样本分属k个正态总体；
然后基于马氏距离，依次建立建立判别函数和判别规则；
基于样本信息，估计判别规则中的未知参数；
带入未知样本信息，判别其类别。

（1）协方差矩阵相同：线性判别

（2）协方差矩阵不同：非线性判别

最低0.47元/天解锁文章

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
数据分析学习总结笔记08：数据分类典型方法及其R语言实现

数据分析学习总结笔记08：数据分类典型方法及其R语言操作1 判别分析1.1 判别分析简介1.1.1 判别分析概念1.1.2 判别分析的种类1.2 距离判别法1.2.1 两总体距离判别1.2.2 多总体距离判别1.3 Fisher 判别法1.3.1 Fisher 判别法原理1.3.2 Fisher 判别法步骤1.4 Bayes 判别法1.4.1 Bayes 判别法概念1.4.2 概率判别1.4.3 ...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。