R做判别分析

最新推荐文章于 2023-05-08 22:49:15 发布

华仔宝宝

最新推荐文章于 2023-05-08 22:49:15 发布

阅读量593

点赞数

分类专栏： R与数据分析文章标签： r语言

本文链接：https://blog.csdn.net/hua_chang/article/details/105056299

版权

本文介绍了如何使用R进行判别分析，包括线性判别法、距离判别法、Bayes判别法，并通过R代码实现了CART算法。还探讨了R中的决策树分析，利用rpart扩展包进行分类，并展示了人工神经网络的训练过程。

摘要由CSDN通过智能技术生成

线性判别法：

library(MASS)
ld=lda(G~x1+x2)
z=predict(ld)
newG=z $c l a s s c b i n d = (G, z$ x,newG)
在这里插入图片描述

距离判别法

该方法适用于连续型随机变量的判别类，对变量的概率分布没有限制。
R程序名：（distinguish.distance.R）

distinguish.distance <- function
(TrnX, TrnG, TstX = NULL, var.equal = FALSE){
if ( is.factor(TrnG) == FALSE){
mx <- nrow(TrnX); mg <- nrow(TrnG)
TrnX <- rbind(TrnX, TrnG)
TrnG <- factor(rep(1:2, c(mx, mg)))
}
if (is.null(TstX) == TRUE) TstX <- TrnX
if (is.vector(TstX) == TRUE) TstX <- t(as.matrix(TstX))
else if (is.matrix(TstX) != TRUE)
TstX <- as.matrix(TstX)
if (is.matrix(TrnX) != TRUE) TrnX <- as.matrix(TrnX)
nx <- nrow(TstX)
blong <- matrix(rep(0, nx), nrow=1,
dimnames=list(“blong”, 1:nx))
g <- length(levels(TrnG))
mu <- matrix(0, nrow=g, ncol=ncol(TrnX))
for (i in 1:g)
mu[i,] <- colMeans(TrnX[TrnGi,])
D < -matrix(0, nrow=g, ncol=nx)
if (var.equal == TRUE || var.equal == T){
for (i in 1:g)
D[i,] <- mahalanobis(TstX, mu[i,], var(TrnX))
}else{
for (i in 1:g)
D[i,] <- mahalanobis(TstX, mu[i,], var(TrnX[TrnGi,]))
}
for (j in 1:nx){
dmin <- Inf
for (i in 1:g)
if (D[i,j] < dmin){
dmin <- D[i,j]; blong[j] <- i
}}blong}

在程序中输入变量TrnX表示训练样本，输入格式为数据框、矩阵或向量；TrnG是因子变量，表示输入训练样本的分类情况；TstX是待测样本，其输入格式为数据框、矩阵或向量；输入变量var.equal是逻辑变量，为TURE时表示两个总体的协方差阵相同，否则为不同。

例子：X<-iris[,1:4]
G<-gl(3,50)
source(“distinguish.distance.R”)
distinguish.distance(X,G)

Bayes判别法

假定对研究对象已有一定的认识，当取得样本后，就可以用样本来修正已有的先验概率分布，得出后验概率分布。
（R程序名：distinguish.bayes.R）

distinguish.bayes <- function
(TrnX, TrnG, p = rep(1, length(levels(TrnG))),
TstX = NULL, var.equal = FALSE){
if ( is.factor(TrnG) == FALSE){
mx <- nrow(TrnX); mg <- nrow(TrnG)
TrnX