机器学习之SVM(粗略的笔记)

SVM引入

 
SVM SupportVectorMachine 称,它的中文名 支持向量机,属于一种有 督的机器
算法,可用于离散因 量的分 连续 量的 预测 。通常情况下, 算法相 于其他
一的分 算法(如 Logistic 、决策 、朴素 叶斯、 KNN 等)会有更好的 预测 准确率,主要是
它可以将低 维线 性不可分的空 间转换为 线 性可分空 。由于 算法具有 高的
准确率,所以其 受企 界的 迎,如利用 算法 实现 疗诊 断、 识别 、文本分 、市
场营销 等。
 
算法的思想就是利用某些支持向量所构成的 超平面 ,将不同 类别 本点 行划
分。不管 本点是 线 性可分的、近似 线 性可分的 是非 线 性可分的,都可以利用 超平面
本点以 高的准确度切割开来。需要注意的是,如果 本点 线 性可分,就要借助于核函数
实现样 本在核空 下完成 线 性可分的操作。关 超平面 如何构造, 在本章的内
容中会有所介
运用 SVM 模型 行分 预测时 具有几个 著的 点:例如,由于 SVM 模型最
所形成的分 于一些支持向量, 致模型具有很好的 棒性(增加或 除非支
持向量的 本点,并不会改 器的效果)以及避免 度灾 生(模型并不会随数据
度的提升而提高 算的复 度);模型具有很好的泛化能力,一定程度上可以避免模型的
合;也可以避免模型在运算 程中出 的局部最 。当然, 算法的缺点也是明 的,例如
模型不适合大 本的分 预测 ,因 它会消耗大量的 源和 时间 ;模型 缺失 本非常
敏感, 就需要建模前清洗好每一个 观测样 本; 然可以通 核函数解决非 线 性可分 问题 ,但
是模型 核函数的 选择 也同 很敏感; SVM 黑盒模型(相比于回 或决策 等算法), 对计
算得到的 果无法解
 
支持向量的概念:
训练数据集的样本点中与分离超平面距离最近的样本点的实例称为支持向量,支持向量是使约束条件使wxi+b=+-1的点。
 

函数间隔

几何间隔:

将函数 隔做 位化 理后,得到的 γ i 就是点 x i 到分割面 w ' x + b =0 的距
离,所以 γ i 被称 几何 隔。

 

 svm原理

求解能够正确划分训练数据集并且几何间隔最大的分离超平面。

 

1、对于线性可分数据时,通过硬间隔最大化,学习一个线性的分类器;

目标函数:

 

2、对于近似线性可分数据时,通过软间隔最大化,学习一个线性的分类器,通过加松弛因子;

3、对于线性不可分数据时,通过核技巧使软间隔最大化,学习一个非线性的分类器。

 

优缺点

优点:

  1. 由于SVM模型最终所形成的分于一些支持向量,致模型具有很好的棒性(增加或除非支持向量的本点,并不会改器的效果);
  2. 避免度灾生(模型并不会随数据维度的提升而提高算的复度);
  3. 模型具有很好的泛化能力,一定程度上可以避免模型的过拟合;
  4. 也可以避免模型在运算程中出的局部最
 

缺点:

  1. 计算成本高,计算速度慢,内存消耗大,
  2. 模型过程及结果难以解释,
  3. 对缺失数据敏感

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值