【李航统计学】Chap2：感知机及代码实现

最新推荐文章于 2021-07-14 19:10:12 发布

baekii

最新推荐文章于 2021-07-14 19:10:12 发布

阅读量513

点赞数 2

分类专栏：统计学笔记文章标签：机器学习 python

本文链接：https://blog.csdn.net/qq_36977302/article/details/108554542

版权

Chap2：感知机

1. 感知机模型
2. 感知机学习策略
- 2.1 损失函数
- 2.2 范数
3. 感知机学习算法
4. 总结
5. 代码实现

1. 感知机模型

在这里插入图片描述

感知机 是二类分类的线性分类模型，其输入为实例的特征向量，输出为实例的类别，取+1和-1二值。感知机对应于输入空间（特征空间）中将实例划分为正负两类的分离超平面，属于判别模型。
感知机模型的假设空间是定义在特征空间中的所有线性分类模型（linear classification medel）或线性分类器（linear classifier），即函数集合 ${f|f(x) = w·x+b\}$

在这里插入图片描述

分离超平面（separating hyperplane）:线性方程 $w \cdot x + b = 0$ 对应于特征空间 $R^n$ 中的一个超平面，其中 $w$ 是超平面的法向量， $b$ 是超平面的截距，这个特征空间因此被划分为两个部分，两部分的点分别分为正负两类，则超平面S则被称为分离超平面。

2. 感知机学习策略

线性可分数据集（linearly separable dataset）: 即存在某个超平面能够将数据集二点正实例点和复实例点完全正确的划分到超平面的两侧，即对所有 $y_i=+1$ 的实例 $i$ ，有 $w·x_i+b>0$ ，对于所有 $y_i=-1$ 的实例 $i$ ，有 $w·x_i+b<0$ 。

==> 确定学习策略，即定义（经验）损失函数并将损失函数极小化

2.1 损失函数

损失函数的一个自然选择是误分类点的综述，但这样的损失函数不是参数 $w, b$ 的连续可导函数不易优化。故感知机选择误分类点到超平面S的总距离，作为其损失函数。
输入空间 $R^n$ 中任一点 $x_0$ 到超平面 $S$ 的距离( $∣ ∣ w ∣ ∣$ 是 $w$ 的 $L_2$ 范数，2.2中补充)：
$\frac{1}{||w||}|w·x_0+b|$
当 $w·x_i+b>0$ 时， $y_i=+1$ ； $w·x_i+b<0$ 时， $y_i=-1$ 的实例 $i$ ，所以呢~距离应该表示为：

最低0.47元/天解锁文章

baekii

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
【李航统计学】Chap2：感知机及代码实现

Chap2：感知机1. 感知机模型2. 感知机学习策略2.1 损失函数2.2 范数1. 感知机模型感知机是二类分类的线性分类模型，其输入为实例的特征向量，输出为实例的类别，取+1和-1二值。感知机对应于输入空间（特征空间）中将实例划分为正负两类的分离超平面，属于判别模型。感知机模型的假设空间是定义在特征空间中的所有线性分类模型（linear classification medel）或线性分类器（linear classifier），即函数集合{f∣f(x)=w⋅x+b}\{f|f(x) = w
复制链接

扫一扫