线性判别法:
library(MASS)
ld=lda(G~x1+x2)
z=predict(ld)
newG=z c l a s s c b i n d = ( G , z class cbind=(G,z classcbind=(G,zx,newG)
距离判别法
该方法适用于连续型随机变量的判别类,对变量的概率分布没有限制。
R程序名:(distinguish.distance.R)
distinguish.distance <- function
(TrnX, TrnG, TstX = NULL, var.equal = FALSE){
if ( is.factor(TrnG) == FALSE){
mx <- nrow(TrnX); mg <- nrow(TrnG)
TrnX <- rbind(TrnX, TrnG)
TrnG <- factor(rep(1:2, c(mx, mg)))
}
if (is.null(TstX) == TRUE) TstX <- TrnX
if (is.vector(TstX) == TRUE) TstX <- t(as.matrix(TstX))
else if (is.matrix(TstX) != TRUE)
TstX <- as.matrix(TstX)
if (is.matrix(TrnX) != TRUE) TrnX <- as.matrix(TrnX)
nx <- nrow(TstX)
blong <- matrix(rep(0, nx), nrow=1,
dimnames=list(“blong”, 1:nx))
g <- length(levels(TrnG))
mu <- matrix(0, nrow=g, ncol=ncol(TrnX))
for (i in 1:g)
mu[i,] <- colMeans(TrnX[TrnGi,])
D < -matrix(0, nrow=g, ncol=nx)
if (var.equal == TRUE || var.equal == T){
for (i in 1:g)
D[i,] <- mahalanobis(TstX, mu[i,], var(TrnX))
}else{
for (i in 1:g)
D[i,] <- mahalanobis(TstX, mu[i,], var(TrnX[TrnGi,]))
}
for (j in 1:nx){
dmin <- Inf
for (i in 1:g)
if (D[i,j] < dmin){
dmin <- D[i,j]; blong[j] <- i
}}blong}
在程序中输入变量TrnX表示训练样本,输入格式为数据框、矩阵或向量;TrnG是因子变量,表示输入训练样本的分类情况;TstX是待测样本,其输入格式为数据框、矩阵或向量;输入变量var.equal是逻辑变量,为TURE时表示两个总体的协方差阵相同,否则为不同。
例子:X<-iris[,1:4]
G<-gl(3,50)
source(“distinguish.distance.R”)
distinguish.distance(X,G)
Bayes判别法
假定对研究对象已有一定的认识,当取得样本后,就可以用样本来修正已有的先验概率分布,得出后验概率分布。
(R程序名:distinguish.bayes.R)
distinguish.bayes <- function
(TrnX, TrnG, p = rep(1, length(levels(TrnG))),
TstX = NULL, var.equal = FALSE){
if ( is.factor(TrnG) == FALSE){
mx <- nrow(TrnX); mg <- nrow(TrnG)
TrnX