感知机 - 支持向量机

最新推荐文章于 2024-07-05 00:40:37 发布

Shingle_

最新推荐文章于 2024-07-05 00:40:37 发布

阅读量682

点赞数 3

分类专栏：机器学习

本文链接：https://blog.csdn.net/Shingle_/article/details/81953524

版权

本文介绍了感知机与支持向量机的基本概念，包括感知机的线性分类模型、损失函数及学习算法，强调了线性可分与不可分情况下的间隔最大化策略。同时，深入探讨了支持向量机中的核函数选择及其作用，以及序列最小优化（SMO）算法在提高训练效率方面的重要性。

摘要由CSDN通过智能技术生成

1957年由Rosenblatt提出，是神经网络与支持向量机的基础。

f (x) = s i g n (w x + b)

$f(x)=sign(wx+b)$

感知机模型对应于输入空间（特征空间）中的分离超平面wx+b=0

m i n w, b L (w, b) = - 1 N \sum i = 1 N y i (w x i + b)

$min_{w,b}L(w,b) = - \frac{1}{N} \sum_{i=1}^{N} y_i(wx_i+b)$

这里写图片描述

损失函数对应于误分类点到分离超平面的总距离 （几何间隔）：

- 1 | | w | | \sum i = 1 N y i (w x i + b)

$- \frac{1}{||w||} \sum_{i=1}^{N} y_i(wx_i+b)$

算法：

1. 选取初值w0, b0
2. 训练集中选取数据（xi, yi）
3. if yi(w·xi+b) <= 0：
     w := w + \alpha yixi
     b := b + \alpha yi
4. 转至2，知道训练集中没有误分类点

优：泛化错误率低、计算开销不大、结果易解释

缺：对参数调节和核函数的选择敏感

线性可分：可以用一条直线将两组数据分开。

超平面：将数据集分隔开的直线或平面称为超平面（hyperplane），也就是分类的决策边界。

间隔：希望找到离分隔超平面最近的点，确保它们离超平面的距离尽可能远。点到分隔面的距离称为间隔。

支持向量：离分隔超平面最近的那些点。

回顾点到直线的距离公式：

d = | A x 0 + B y 0 + C 0

关注

专栏目录