![7474b1528c149719f136bf74062ebac3.png](https://img-blog.csdnimg.cn/img_convert/7474b1528c149719f136bf74062ebac3.png)
支持向量机(Support Vector Machine, SVM)最早提出于1964年,是监督学习中的一类。SVM的基本原理是基于一个分离超平面,将数据集准确的进行划分,且该平面的几何间隔最大化。因此,对于一个线性可分的数据集而言,尽管线性可分离平面存在无穷多个,但几何间隔最大的分离超平面是唯一的。目前,SVM主要应用于人像识别,分类等场景中。 下面,我们一起来看一下支持向量机模型的构建过程。大家好,我是阿琛。机器学习在生信分析中的三大经典模型:LASSO模型,随机森林模型和支持向量机模型。在前面的内容中,我们分别介绍了LASSO模型(高分生信秘籍!手把手叫你构建LASSO Cox回归模型)和随机森林模型(临床预测模型必会的知识点,学会了再给你的SCI加1分的工作量!)的构建方法。今天,我们一起来看一下最后一种经典模型,即支持向量机模型。
1.R包的安装与读取
rm(list = ls()) #清空环境变量options(stringsAsFactors = F)###1. R包的安装与读取if(!require(e1071))install.packages("e1071")if(!require(Hmisc))install.packages("Hmisc")if(!require(ggpubr))install.packages("ggpubr")if(!require(ROCR))install.packages("ROCR")library(e1071) #svmlibrary(Hmisc)library(ggpubr)library(ROCR)
e1071包是用于进行支持向量机分析的R包。尽管名字看似简单,但内部包含了多种功能强大的相关函数,包括模型优化的tune.svm()函数,以及一些核函数,使用起来简单方便。
2.数据读取与处理
#读取表达数据rt "exp.txt", header=T, sep=exp 1))head(exp)[1:4, 1:4]
#读取临床数据cli <- read.table("cliData.txt",header=T,sep=" ",check.names=F, row.names