感知机模型

最新推荐文章于 2024-12-06 22:45:04 发布

天空下的斌

最新推荐文章于 2024-12-06 22:45:04 发布

阅读量3.4k

点赞数 4

分类专栏：机器学习文章标签：机器学习-深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/a595130080/article/details/53159082

版权

本文详细介绍了感知机模型，包括模型概览、定义、学习策略和学习算法。感知机是用于二分类的线性模型，通过寻找最佳超平面实现数据划分。文章还探讨了损失函数、随机梯度下降法以及算法的收敛性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

感知机模型

1. 模型概览

方法：感知机模型
适用问题：二分类
模型特点：分离超平面
模型类型：判别模型
学习策略：极小化误分点到超平面距离
损失函数：误分点到超平面距离
学习算法：随机梯度下降法

2. 模型介绍

感知机(perceptron)是处理二分类的线性分类模型。感知机旨在求出将训练数据进行线性划分的分离超平面，属于判别模型，所以，导入误分类的损失函数，利用梯度下降法极小化损失函数，求得感知机模型，感知机预测是用学习得到的感知机模型对新输入的数据进行分类。感知机在1957年由Rosenblatt提出，是神经网络和支持向量机的基础。

3. 模型定义

由输入空间到输出空间的如下函数：

f (x) = s i g n (w \cdot x + b)

$f(x)=sign(w\centerdot x+b)$

称为感知机。其中w为权重，b为偏置，sign为符号函数：

s i g n (x) = {+ 1, x \geq 0 - 1, x < 0

$sign(x)=\left\{ \begin{align} & +1,x\ge 0 \\ & -1,x<0 \\ \end{align} \right.$

所以，感知机输出是{+1，-1}.

几何解释：
线性方程

w x + b = 0

$wx+b=0$

对应特征空间的一个超平面S，其中w为该平面的法向量，b为超平面的截距。这个超平面将特征空间分为两个部分，位于两部分的点分别被分为正负两类，因此，超平面S被称为分离超平面。如下图所示：

分离平面示意图

4. 感知机学习策略

首先解释一下什么是线性可分：对包含正负样例点的集合T，如果存在一个超平面S能够将所有正负样例点完全分在平面两侧，则称T为线性可分的，否则为线性不可分。感知机模型就是假设训练集合为线性可分的。

接下来我们定义损失函数，并将其最小化。感知机模型的损失函数为所有误分类点到超平面的距离和，这很好理解。不选择误分类点的个数是因为，它不是w,b的连续可导函数，不好优化。损失函数形式如下：

L (w, b) = - \sum x i \in M y i (w \cdot x i + b)

$L(w,b)=-\sum\limits_{{{x}_{i}}\in M}{{{y}_{i}}}(w\centerdot {{x}_{i}}+b)$

我们来推导一下：
空间任意点 ${{x}_{0}}$ 到超平面S的距离为：

1 ∥ w ∥ | w \cdot x 0 + b |

$\frac{1}{\left\| w \right\|}\left| w\centerdot {{x}_{0}}+b \right|$

这里 $\left\| w \right\|$ 为w的二范数。
其次，对于误分类的数据 $({{x}_{i}},{{y}_{i}})$ 来说

- y i (w \cdot x i + b) > 0

$-{{y}_{i}}(w\centerdot {{x}_{i}}+b)>0$
因为

|yi|=1 $\left| {{y}_{i}} \right|=1$ ，对于误分点数据

(xi,yi) $({{x}_{i}},{{y}_{i}})$ 有：

| w \cdot x i + b | = | y

最低0.47元/天解锁文章

天空下的斌

博客等级

码龄10年

12
原创

46
点赞

120
收藏

89
粉丝

关注

私信

热门文章

分类专栏

最新评论

Spark简要教程系列（一） Mac安装Spark
qq_41182643: 太感谢了,唯一一个终端小白都看得懂的教程
Spark简要教程系列（一） Mac安装Spark
Innocent^_^: 我给博主补充一下吧，是文件路径的问题，不能带有空格
Spark简要教程系列（一） Mac安装Spark
Innocent^_^: 失败了。。。 starting org.apache.spark.deploy.master.Master, logging to /Volumes/macOS File/Java Spark/spark-3.0.1-bin-hadoop2.7/logs/spark-tugang-org.apache.spark.deploy.master.Master-1-TuGangsdeMacBook-Pro.local.out /Volumes/macOS File/Java Spark/spark-3.0.1-bin-hadoop2.7/sbin/spark-daemon.sh: line 128: $log: ambiguous redirect failed to launch: nice -n 0 /Volumes/macOS File/Java Spark/spark-3.0.1-bin-hadoop2.7/bin/spark-class org.apache.spark.deploy.master.Master --host TuGangsdeMacBook-Pro.local --port 7077 --webui-port 8080 tail: /Volumes/macOS File/Java Spark/spark-3.0.1-bin-hadoop2.7/logs/spark-tugang-org.apache.spark.deploy.master.Master-1-TuGangsdeMacBook-Pro.local.out: No such file or directory full log in /Volumes/macOS File/Java Spark/spark-3.0.1-bin-hadoop2.7/logs/spark-tugang-org.apache.spark.deploy.master.Master-1-TuGangsdeMacBook-Pro.local.out
深度学习实战（一）快速理解实现风格迁移
weixin_43287560: 博主你好，代码中训练结束后保存图片的名称是在哪里设置的？我按照你的运行提示跑一直报valueError
深度学习实战（一）快速理解实现风格迁移
天空下的斌回复 xjtuzr: 跑出一张照片只需要跑一次模型，按概念来说使用一次神经网络，但不是三层的。

大家在看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。