《统计学习方法：李航》笔记从原理到实现（基于python）-- 第 2章感知机

北方骑马的萝卜

已于 2024-01-29 18:10:16 修改

阅读量1.1k

点赞数 33

分类专栏：机器学习笔记文章标签：学习方法笔记 python 机器学习

于 2024-01-23 11:06:37 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42046845/article/details/135766520

版权

文章目录

第 2章感知机

《统计学习方法：李航》笔记从原理到实现（基于python）-- 第 2章感知机
《统计学习方法：李航》笔记从原理到实现（基于python）-- 第1章统计学习方法概论

我算是有点基础的（有过深度学习和机器学的项目经验），但也是半路出家，无论是学Python还是深度学习，都是从问题出发，边查边做，没有系统的学过相关的知识，这样的好处是入门快（如果想快速入门，大家也可以试试，直接上手项目，从小项目开始），但也存在一个严重的问题就是，很多东西一知半解，容易走进死胡同出不来（感觉有点像陷入局部最优解，找不到出路），所以打算系统的学习几本口碑比较不错的书籍。
书籍选择： 当然，机器学习相关的书籍有很多，很多英文版的神书，据说读英文版的书会更好，奈何英文不太好，比较难啃。国内也有很多书，周志华老师的“西瓜书”我也有了解过，看了前几章，个人感觉他肯能对初学者更友好一点，讲述的非常清楚，有很多描述性的内容。对比下来，更喜欢《统计学习方法》，毕竟能坚持看完才最重要。
笔记内容： 笔记内容尽量省去了公式推导的部分，一方面latex编辑太费时间了，另一方面，我觉得公式一定要自己推到一边才有用（最好是手写）。尽量保留所有标题，但内容会有删减，通过标黑和列表的形式突出重点内容，要特意说一下，标灰的部分大家最好读一下（这部分是我觉得比较繁琐，但又不想删掉的部分）。
代码实现： 最后是本章内容的实践，如果想要对应的.ipynb文件，可以留言

第 2章感知机

感知机 (perceptron) 是二类分类的线性分类模型，其输入为实例的特征向量，输出为实例的类别，取 +1 和-1 二值。

感知机对应于输入空间(特征空间)中将实例划分为正负两类的分离超平面，属于判别模型。

感知机学习旨在求出将训练数据进行线性划分的分离超平面，为此：

导入基于误分类的损失函数，

利用梯度下降法对损失函数进行极小化，求得感知机模型。

感知机学习算法具有简单而易于实现的优点，分为 原始形式和对偶形式。

2.1 感知机模型

感知机是一种线性分类模型，属于判别模型。

感知机模型的假设空间是定义在特征空间中的所有线性分类模型(linear classification modeD 或线性分类器 (linear classifier) ，即函数集合

${ {f|f(x) = ω • x + b}}$

几何解释：线性方程

$ω\cdot x+b=0$

对应于特征空间 $R^n$ 中的一个超平面 S ，其中 ω 是超平面的法向量 ， b 是超平面的截距。

这个超平面将特征空间划分为两个部分。位于两部分的点(特征向量)分别被分为正、负两类。因此，超平面 S称为分离超平面 (separating hyperplane) ，如图 2.1 所示。

2.2 感知机学习策略

2.2.1 数据集的线性可分性

给定一个数据集T:

$T = {(x_l ,y_1), (x_2 ,y_2) ,… , (x_n,y_n)}$

其中， $x_i \in X = R^n, y_i \in Y=(+1 ,-1) ， i= 1 ， 2，… ， n$

如果存在某个超乎面 S

$ω\cdot x+b=0$

能够将数据集的正实例点和负实例点完全正确地划分到超平面的两侧，则称数据集 T 为线性可分数据集( linearly separable data set ) ;否则，称数据集 T 线性不可分。

2.2.2 感知机学习策略

假设训练数据集是线性可分的，感知机学习的目标是求得一个能够将训练集正实例点和负实例点完全正确分开的分离超平面。
在这里插入图片描述

损失函数的一个自然选择是误分类点的总数。但是，这样的损失函数不是连续可导函数，不易优化。损失函数的另一个选择是误分类点到超平面 S 的总距离。

输入空间 $R^n$ 中任一点 $x_o$ 到超平面 $S$ 的距离:

$\frac{1}{||w||}|w \cdot x_0+b|$

最低0.47元/天解锁文章

北方骑马的萝卜

关注

33
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
《统计学习方法：李航》笔记从原理到实现（基于python）-- 第 2章感知机

《统计学习方法：李航》笔记从原理到实现（基于python）-- 第 2章感知机
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。