支持向量机(SVM)和决策树(Decision Tree)简介

本文介绍了支持向量机(SVM)的基本思想,包括线性可分和近似线性可分的情况,并转换为优化问题。接着,概述了决策树(Decision Tree)的主要思想,讨论了信息熵、信息增益等概念,以及ID3、C4.5和CART等决策树算法。
摘要由CSDN通过智能技术生成

一、支持向量机(SVM)

  主要思想:找一个超平面,使其尽可能多地将两类数据点分开,还要使得分开的数据点距分类面尽可能地远.

1. 线性可分的支持向量机

  设有一组观测样本: D = { ( x i , y i ) ∣   i = 1 , 2 , ⋯   , n , x i ∈ X ⊆ R m , y i ∈ { 1 , − 1 } } \small D=\lbrace (x_i,y_i)|\,i=1,2,\cdots,n,x_i\in X\subseteq R^m,y_i\in \lbrace1,-1\rbrace \rbrace D={ (xi,yi)i=1,2,,n,xiXRm,yi{ 1,1}}. 根据标签 y i y_i yi 将其分为两类: D 1 = { ( x i , y i ) ∣   y i = 1 } , D 2 = { ( x i , y i ) ∣   y i = − 1 } . \small D_1=\lbrace(x_i,y_i) |\,y_i=1\rbrace,D_2=\lbrace(x_i,y_i) |\, y_i=-1\rbrace. D1={ (xi,yi)yi=1},D2={ (xi,yi)yi=1}.
  已知 D 1 , D 2 \small D_1,D_2 D1,D2 线性可分,即存在一个超平面能够将两类点完全分隔开. 然后寻找这样的一个超平面 w T x + b = 0 w^Tx+b=0 wTx+b=0 (其中 w w w 表示超平面的法向量),不仅能够满足分隔条件,而且能够使分开的数据点距超平面尽可能地远. 该问题可以表示为优化问题,数学描述如下: m a x    ρ s . t . { w T x i + b ≥ l , x i ∈ D 1 w T x i + b ≤ − l , x i ∈ D 2 \begin{aligned}&max\;\rho\\ &s.t. \begin{cases} w^Tx_i+b\geq l, & x_i \in D_1\\ w^Tx_i+b\leq -l, & x_i \in D_2 \end{cases}\end{aligned} maxρs.t.{ wTxi+bl,wTxi+bl,xiD1xiD2其中 w T x i + b = l , w T x i + b = − l ( l > 0 ) w^Tx_i+b= l,w^Tx_i+b= -l(l>0) wTxi+b=l,w<

  • 7
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值