【机器学习】感知机学习---《统计学习方法》学习笔记

最新推荐文章于 2022-09-12 21:52:42 发布

may-bee

最新推荐文章于 2022-09-12 21:52:42 发布

阅读量2.2k

点赞数

分类专栏：统计学习方法文章标签：机器学习统计学习方法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jie310300215/article/details/50956754

版权

统计学习方法专栏收录该内容

1 篇文章 0 订阅

订阅专栏

开始学习机器学习有一段时间了，一开始认为做应用的只知道简单的理论就够了，因此更加倾向于学习《机器学习实战》、《集体智慧编程》这类书籍，在学习了一段时间后，尤其是看了一段时间斯坦福大学的公开课以后，有一种强烈的欲望想要去学习机器学习中的数学，但是迫于自身数学能力不是很强，啃起《统计学习方法》这本书来，还是有一定难度的。只作为一个笔记，以后可以温故而知新。

在真正开始学习之前，其实统计学习方法中还是有一些基本概念需要理解的，在书中第一章。

基本概念

基本模型：

f (x) = s i g n (w \cdot x + b)

$f(x) = sign(w\cdot x + b)$
其中：

s i g n (x) = {+ 1, x \geq 0 - 1, x < 0

$sign(x) = \{ \begin{matrix} +1, x\ge0 \\ -1, x\lt0 \end{matrix}$

这是一种线性分类模型，属于判别模型。

定义：假设输入空间（特征空间）是 $\chi \subseteq \mathbb{R}^{n}$ ，输出空间为 $y= \left\{\begin{matrix}+1\\ -1\end{matrix}\right.$ ，输入表示实例的特征向量，对应于输入空间的点；输出表示实例的类别。由输入空间到输出空间的如下函数：

f (x) = s i g n (w \cdot x + b)

$f(x) = sign(w\cdot x + b)$ 称为 感知机。其中，

ω $\omega$ 和

b $b$ 为感知机模型的参数。

ω∈R $\omega \in \mathbb{R}$ 叫做 权值（weight），

b∈R $b \in \mathbb{R}$ 叫做 偏置（bias）。

学习策略

目的：找出一个线性可分的超平面，定义一个损失函数，求 $\omega$ 和 $b$ ，并将损失函数极小化。

损失函数的选取：

自然选择是误分类点的个数，但是这个函数并不是参数的连续可导函数，不易于优化；
可以选择误分类点到超平面的距离，即：
1∥ω∥|ω⋅x+b|,∥ω∥为ω的L2范数

推导过程：
对于任何误分类点来说：

−yi(ω⋅xi+b)>0，

1∥ω∥|ω⋅x+b|=−1∥ω∥yi(ω⋅xi+b)，

因此，所有误分类点到超平面的距离之和为：
L(ω,b)=−1∥ω∥∑xi∈Myi(ω⋅xi+b)，M为所有的误分类点。

L(ω,b) 即为感知机模型的损失函数。

学习算法

现在的问题变成了求解 $L\left( \omega, b \right)$ 的最优化问题。在这里有两种形式：原始形式和对偶形式。

原始形式

描述：给定数据集 $T=\left \{ \left ( x_{1},y_{1} \right ),\left( x_{2},y_{2} \right )\cdot \cdot \cdot \left ( x_{n},y_{n} \right ) \right \}$ 。其中， $x_{i} \in X = \mathbb{R}$ ， $y_{i} \in Y= \left \{ +1, -1 \right \}. i=1,2,3 \cdot \cdot \cdot, N$ ，求参数 $\omega，b$ ，使其成为以下最优化问题的解：

minw,bL(ω,b)=−∑xi∈Myi(ωxi+b)，
其中 M 为误分类点的集合。

随机梯度下降法：建议查阅相关资料。

求解（求梯度）：

对于 $\omega$ 求偏导：
▽ω(ω,b)=−∑xi∈Myixi，

对于 b 求偏导：
▽b(ω,b)=−∑xi∈Myi

随机选取误分类点 $\left ( x_{i}, y_{i} \right ),$ 对于 $\omega, b$ 进行更新：

ω←ω+ηyixi,

b←b+ηyi,
其中， η 表示为步长或者学习率，控制梯度下降的速度。

综上所述，感知机学习算法的原始形式表述如下：

输入：训练数据集 $T=\left \{ \left ( x_{1},y_{1} \right ),\left( x_{2},y_{2} \right )\cdot \cdot \cdot \left ( x_{n},y_{n} \right ) \right \}$ ，其中， $x_{i} \in X = \mathbb{R}$ ， $y_{i} \in Y= \left \{ +1, -1 \right \}. i=1,2,3 \cdot \cdot \cdot, N$ ；学习率 $\eta （0 < \eta \leq 1）$ ；

输出： $\omega, b$ ；感知机模型 $f\left ( x \right )=sign\left ( \omega \cdot x + b \right )$ 。

步骤：
1. 选取初值 $\omega_{0}, b_{0}$ ；
2. 在训练集中选取数据 $\left (x_{i}, y_{i} \right)$ ；
3. 如果 $y_i \left ( \omega \cdot x_i + b \right) \leq 0 ：$ $ω \leftarrow ω + η y i x i,$ $\omega \leftarrow \omega + \eta y_{i} x_{i},$ $b \leftarrow b + η y i$ $b\leftarrow b + \eta y_{i}$
4. 转至step2，直到训练集中没有误分类点。
对偶形式

不想写了。。。。。。。

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。