判别分析

应用多元分析

多元分析是多变量的统计分析方法,主要包括回归分析、方差分析、判别分析、聚类分析、
主成分分析、因子分析和典型相关分析

一、判别分析

判别分析是用以判别个体所属群体的统计方法;判别分析又称为“分辨法”,是在分类确定的条件下,根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法。

常见的判别分析方法有:距离判别法、贝叶斯判别法和Fisher判别法.

1).距离判别法

基于距离判别法的数据挖掘算法有很多:聚类算法中的层次聚类法、k-均值法、k-中心法等,判别分析实际上也是分类算法的一种。
常见的距离有欧氏距离、马氏距离、曼哈顿距离等.(更多地距离方法可参见博文).

欧式距离在测量距离远近时,没有考虑概率分布的影响(方差的影响)且容易受量纲的影响,因而用马氏距离来度量距离的远近。具体看《统计建模与R软件》

有关距离判别法,k最领近算法(KNN)使用最为广泛,K是分析人员要给定的值.

# R语言实现:

可以用class包中的knn()函数,knn()函数的语法和参数如下:

knn(train,test,cl,k=1,l=0,prob=F,use.all=T)

说明:train指定训练样本集;test指定测试样本集;cl指定训练样本集中 分类变量;

k指定最邻近的k个已知分类样本点,默认为1;l指定待判样本点属于某类的最少已知分类样本数,默认为0

  • 2
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值