R语言实现支持向量机(SVM)


数据介绍

本问使用的数据集与R语言实现决策树的数据集相同,详情可参考这篇文章.


一、相关R包的下载

本文实现SVM及相关图形绘制的R包如下:

library(e1071)
library("pROC")

二、实现过程

1.数据读取与数据集划分

read.table("D:\\Rprojects\\tree.csv",header=TRUE,sep=",")->mydata #读取数据
mydata$group<-factor(mydata$group)
sub<-sample(1:392,260)#260个样例作为训练集,其余作为测试集
train<-mydata[sub,]
test<-mydata[-sub,]

2.构建SVM模型

利用SVM包实现:支持向量机

svm_model = svm(group~.,data=train,knernel = "radial")

模型信息显示:

summary(svm_model)

在这里插入图片描述

3.模型验证

对测试集数据进行预测,并输出混淆矩阵

svm_pred=predict(svm_model,test,decision.values = TRUE)
test$svm_pred = svm_pred
head(test)
table(test$group,test$svm_pred)
混淆矩阵casecontrol
case331
control098

绘制ROC曲线图及分类情况显示图:

#绘制ROC曲线
ran_roc <- roc(test$group,as.numeric(svm_pred))
plot(ran_roc, print.auc=TRUE, auc.polygon=TRUE, grid=c(0.1, 0.2),grid.col=c("green", "red"), max.auc.polygon=TRUE,auc.polygon.col="skyblue", print.thres=TRUE,main='SVM模型ROC曲线')


attr(svm_pred,"decision.values")[1:9,]
plot(cmdscale(dist(test[,-10])),
    col = as.integer(test[,10]),
    pch=c("o","+")[1:132 %in% svm_model$index+1])

在这里插入图片描述

在这里插入图片描述


完整代码如下:

#SVM

library(e1071)
library("pROC")

read.table("D:\\Rprojects\\tree.csv",header=TRUE,sep=",")->mydata #读取数据
mydata$group<-factor(mydata$group)
sub<-sample(1:392,260)#260个样例作为训练集,其余作为测试集
train<-mydata[sub,]
test<-mydata[-sub,]

#模型建立
svm_model = svm(group~.,data=train,knernel = "radial")
summary(svm_model)

#模型预测
svm_pred=predict(svm_model,test,decision.values = TRUE)
test$svm_pred = svm_pred
head(test)
table(test$group,test$svm_pred)

#绘制ROC曲线
ran_roc <- roc(test$group,as.numeric(svm_pred))
plot(ran_roc, print.auc=TRUE, auc.polygon=TRUE, grid=c(0.1, 0.2),grid.col=c("green", "red"), max.auc.polygon=TRUE,auc.polygon.col="skyblue", print.thres=TRUE,main='SVM模型ROC曲线')


attr(svm_pred,"decision.values")[1:9,]
plot(cmdscale(dist(test[,-10])),
    col = as.integer(test[,10]),
    pch=c("o","+")[1:132 %in% svm_model$index+1])


总结

支持向量机具有很高的预测准确率,其思想直观,但细节异常复杂,内容设计凸分析算法,核函数,神经网络等领域。其对于简单的线性可分情况将问题转化为凸优化问题,用拉格朗日乘子法简化,然后用既有的算法解决;对于复杂的线性不可分情况,用映射函数将样本投射到高维空间,使其变成线性可分的情况,利用核函数减少高维度计算量。

  • 12
    点赞
  • 240
    收藏
    觉得还不错? 一键收藏
  • 10
    评论
评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值