在svm模型中测试Iris数据集
摘 要 *本次实验的目的是在svm模型中测试下载下来的Iris dataset,并测试调研Iris数据集上分类精度。用到了Iris数据集的数据,结果测试集测试得到了100%的准确分类精度。
关键词 *svm、iris data set、训练集、测试集。
1 Svm与Iris Data Set
1.1 认识Svm----全称SupportVector Machine
支持向量机(英语:Support Vector Machine,常简称为SVM)是一种监督式学习的方法,可广泛地应用于统计分类以及回归分析。
支持向量机属于一般化线性分类器,也可以被认为是提克洛夫规范化(Tikhonov Regularization)方法的一个特例。这族分类器的特点是他们能够同时最小化经验误差与最大化几何边缘区,因此支持向量机也被称为最大边缘区分类器。
支持向量机建构一个或多个高维(甚至是无限多维)的超平面来分类资料点,这个超平面即为分类边界。直观来说,好的分类边界要距离最近的训练资料点越远越好,因为这样可以减低分类器的泛化误差。在支持向量机中,分类边界与最近的训练资料点之间的距离称为间隔(margin);支持向量机的目标即为找出间隔最大的超平面来作为分类边界。