统计学习方法笔记二

最新推荐文章于 2024-09-13 17:02:14 发布

qq阙继婷

最新推荐文章于 2024-09-13 17:02:14 发布

阅读量122

点赞数

分类专栏：机器学习文章标签：机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40306074/article/details/105163457

版权

机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

第二章感知机

一、感知机定义

假设输入空间（特征空间）是 $x\subseteq R^n$ ,输出空间是 $y=\{+1,-1\}$ 。输入 $\in X$ 表示实例的特征向量，对应于输入空间（特征空间）的点；输出 $\in Y$ 表示实例的类型。由输入空间到输出空间的如下函数：
$f(x)=sign(w\cdot x+b)$
称为感知机，感知机是根据输入实例的特征向量x对其进行二类分类的线性分类模型。

感知机模型对应于输入空间（特征空间）中的分离超平面 $w\cdot x+b=0$ 。

二、感知机学习策略

感知机学习的目标是求得一个能够将训练集正实例点和负实例点完全正确分开的分离超平面。

感知机学习的策略是极小化损失函数：在这里插入图片描述
其中M为误分类点的集合，损失函数对应于误分类点到分离超平面的总距离。

三、感知机学习算法

1.原始形式

输入：训练数据集 $T=\{(x_1,y_1),(x_2,y_2),...,(x_N,y_N)\}$ ,其中 $x_i \in X =R^n$ , $y_i \in Y =\{-1,+1\},i=1,2,...N$ ; 学习率 $\eta(0<\eta\leq1)$ ;

输出：w，b；感知机模型 $\cdot x+b)$ 。

(1)选取初值 $w_0,b_0$ ;

(2)在训练集中选取数据 $x_i,y_i)$ ;

(3)如果 $y_i(w \cdot x_i +b)\leq 0$ ,
$w\leftarrow w+\eta y_i x_i$

$\leftarrow b+\eta y_i$

(4)转至(2),直至训练集中没有误分类点。

直观上有如下解释：当一个实例点被误分类，即位于分离超平面的错误一侧时，则调整w,b的值，使分离超平面向该误分类点的一侧移动，以减少该误分类点与超平面间的距离，直至超平面越过该误分类点使其被正确分类。

2.对偶形式

输入：线性可分的数据集 $T=\{(x_1,y_1),(x_2,y_2),...,(x_N,y_N)\}$ ,其中 $x_i \in X ^n$ , $y_i \in \{-1,+1\},i=1,2,...N$ ; 学习率 $\eta(0<\eta\leq1)$ ;

输出： $\alpha$ ，b；感知机模型 $f(x)=sign(\sum_{j=1}^N \alpha _jy_jx_j\cdot x+b)$ ，其中 $\alpha=(\alpha_1,\alpha_2,...,\alpha_N)^T$

(1) $\alpha \leftarrow 0,b \leftarrow 0$ ;

(2)在训练集中选取数据 $x_i,y_i)$ ;

(3)如果 $y_i(\sum_{j=1}^N \alpha_jy_jx_j \cdot x_i+b)\leq0$ ,
$\alpha_i \leftarrow \alpha_i+\eta$

$b\leftarrow b+ \eta y_i$

(4)转至(2)直至没有误分类数据。

对偶形式中训练实例仅以内积的形式出现，可预先将数据集中实例间的内积用Gram矩阵存储

$G=[x_i\cdot x_j]_{N\times N}$

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。