给定的训练样本集,分类学习的基本思想就是在样本空间中找到一个划分的超平面,将不同类别的样本分隔开。
支持向量机,因其英文名为support vector machine,故一般简称SVM,通俗来讲,它是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,其学习策略便是间隔最大化,最终可转化为一个凸二次规划问题的求解。
仍然是使用iris作为实验数据集
iris:数据源于1936年费希尔发表的一篇重要论文。彼时他收集了三种鸢尾花(分别标记为setosa、versicolor和virginica)的花萼和花瓣数据。包括花萼的长度和宽度,以及花瓣的长度和宽度。我们将根据这四个特征来建立支持向量机模型从而实现对三种鸢尾花的分类判别任务。
使用rstudio查看iris数据集内容:
在正是建模之前,可以通过图像来初步判断数据的分布情况
library(lattice)
png(file = "./Desktop/R/iris.png")
xyplot(Petal.Length ~ Petal.Width, data = iris, groups = Spe