SVM常见的面试题整理

原创 2018年04月15日 23:39:22

SVM的原理是什么?

SVM是一种二类分类模型。它的基本模型是在特征空间中寻找间隔最大化的分离超平面的线性分类器。(间隔最大是它有别于感知机)

(1)当训练样本线性可分时,通过硬间隔最大化,学习一个线性分类器,即线性可分支持向量机;

(2)当训练数据近似线性可分时,引入松弛变量,通过软间隔最大化,学习一个线性分类器,即线性支持向量机;

(3)当训练数据线性不可分时,通过使用核技巧及软间隔最大化,学习非线性支持向量机。

SVM为什么采用间隔最大化?

当训练数据线性可分时,存在无穷个分离超平面可以将两类数据正确分开。

感知机利用误分类最小策略,求得分离超平面,不过此时的解有无穷多个。

线性可分支持向量机利用间隔最大化求得最优分离超平面,这时,解是唯一的。另一方面,此时的分隔超平面所产生的分类结果是最鲁棒的,对未知实例的泛化能力最强。

为什么要将求解SVM的原始问题转换为其对偶问题?

一、是对偶问题往往更易求解(当我们寻找约束存在时的最优点的时候,约束的存在虽然减小了需要搜寻的范围,但是却使问题变得更加复杂。为了使问题变得易于处理,我们的方法是把目标函数和约束全部融入一个新的函数,即拉格朗日函数,再通过这个函数来寻找最优点。)

二、自然引入核函数,进而推广到非线性分类问题。

为什么SVM要引入核函数?

当样本在原始空间线性不可分时,可将样本从原始空间映射到一个更高维的特征空间,使得样本在这个特征空间内线性可分。

引入映射后的对偶问题:

在学习预测中,只定义核函数K(x,y),而不是显式的定义映射函数ϕ。因为特征空间维数可能很高,甚至可能是无穷维,因此直接计算ϕ(x)·ϕ(y)是比较困难的。相反,直接计算K(x,y)比较容易(即直接在原来的低维空间中进行计算,而不需要显式地写出映射后的结果)。

核函数的定义:K(x,y)=<ϕ(x),ϕ(y)>,即在特征空间的内积等于它们在原始样本空间中通过核函数K计算的结果。

除了 SVM 之外,任何将计算表示为数据点的内积的方法,都可以使用核方法进行非线性扩展。

为什么SVM对缺失数据敏感?

这里说的缺失数据是指缺失某些特征数据,向量数据不完整。SVM没有处理缺失值的策略(决策树有)。而SVM希望样本在特征空间中线性可分,所以特征空间的好坏对SVM的性能很重要。缺失特征数据将影响训练结果的好坏。

PHP面试题集锦

-
  • 1970年01月01日 08:00

SVM常见面试问题

1、为什么要选择最大间隔分类器,请从数学角度上说明?     答:几何间隔与样本的误分次数间存在关系:          其中的分母就是样本到分类间隔距离,分子中的R是所有样本中的最...
  • whtss
  • whtss
  • 2017-10-07 13:44:36
  • 210

java常见面试题整理

ThreadLocal Synchronized实现内存共享,ThreadLocal为每个线程维护一个本地变量。 采用空间换时间,它用于线程间的数据隔离,为每一个使用该变量的线程提供一个副本,每个...
  • u012998254
  • u012998254
  • 2018-02-10 13:37:55
  • 1195

java常见的120道面试题第一季(每30题为一季,整理的好辛苦~~~)

哎,大晚上的看题,也是醉了,分享给大伙咯!!! 问答题1 /120 什么是Java虚拟机?为什么Java被称作是“平台无关的编程语言”? 参考答案 Java虚拟机是一个可以执行Java字节码的虚拟机进...
  • Summer_YuXia
  • Summer_YuXia
  • 2016-11-25 23:37:10
  • 2106

常见面试题整理---Python代码篇

Python常见面试题整理
  • chibangyuxun
  • chibangyuxun
  • 2016-11-14 17:55:07
  • 391

2017常见的50道Java基础面试题整理(含答案)

1、作用域public,private,protected,以及不写时的区别答: 区别如下:2、Anonymous Inner Class (匿名内部类) 是否可以extends(继承)其它类,是否可...
  • qq_40285302
  • qq_40285302
  • 2018-03-29 21:19:59
  • 17

常见面试题整理--操作系统篇(每位开发者必备)

有过面试经历的人都知道操作系统是面试官必问的几大类型题目之一,在上一期我们已经更新另一大板块的题目常见面试题...
  • Ly4wU5giY
  • Ly4wU5giY
  • 2016-11-22 07:31:26
  • 59

面试题——逻辑题

第1章 数学趣题解析 1.决定了泊松一生道路的数学趣题 泊松(Poisson S.-D,B.,1781.6.21~1840.4.25)法国数学家,曾任过欧洲许多国家科学院的院士,在积分理论、微分...
  • a123bc21
  • a123bc21
  • 2017-10-22 23:48:18
  • 47

机器学习算法面试—口述(1):SVM介绍及常见问题

首先SVM是支持向量机support vector machine的缩写,它是现在使用比较广泛的一个分类算法(二分类),是一个线性分类器! 当数据是线性可分的时候: SVM是在空间找一个分类超平面,将...
  • xwchao2014
  • xwchao2014
  • 2015-08-24 16:36:54
  • 4602

常见的链表面试题大汇总

  • 2015年09月05日 21:10
  • 2.49MB
  • 下载
收藏助手
不良信息举报
您举报文章:SVM常见的面试题整理
举报原因:
原因补充:

(最多只允许输入30个字)