Preceptron感知机

最新推荐文章于 2025-04-29 15:28:57 发布

西柚里特

最新推荐文章于 2025-04-29 15:28:57 发布

阅读量1k

点赞数 24

分类专栏：机器学习文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_54143563/article/details/140171826

版权

机器学习专栏收录该内容

2 篇文章

订阅专栏

前言

在上一章中，我们讨论了回归问题，主要的任务就是拟合出数据集分布的解析式。而这一次的学习中，我们将关注分类问题。

Classification

classification分类有两种：二元分类和多类分类。

二元分类：预测二值目标，在分类问题属于基本问题。

多类分类：预测离散（>2）值目标的二元分类的示例。

分类在实际生活中有什么意义吗？

很多领域都有分类问题，例如，可以根据是否存在各种症状，医生预测患者是否患有疾病；

管理员将电子邮件分类为垃圾邮件或非垃圾邮件；

预测金融交易是否具有欺诈性等。

Binary Linear Classication

二元分类中基础的为二元线性分类。

它的描述如下：

给定D维输入 $x\epsilon R^{D}$ 预测离散值目标。

预测二进制目标 $y\epsilon \left \{ 0,1\right \}$ 或 $y\epsilon \left \{ -1,+1 \right \}$

其中y=1的样本称为正样本，y=0或y=-1的样本称为负样本

模型预测 $\hat{y}$ 是x的线性函数。

我们看下面这样的数据集：

样本有两个维度，y表示样本所属的类别。

在坐标图中绘制出来：

接下来我们的任务就是得到一个预测模型（解析式），对于其他的样本，输入到模型中能够得到它的分类情况。

对于该数据集，我们可以用一条直线将其进行分类，这条直线的解析式可以定义为：

$w^{T}{x}'+b=0$

然后计算不同的数据样本到直线的距离

$d=\frac{w^{T}x+b}{\left \| w \right \|}$

在坐标图中：

因此在直线下面的距离d<0,在直线上面的d>0，然后定义一个符号函数

这样我们就能用直线来对数据进行二元分类了。

另外对于上述求距离的公式，其中 $\left \| w \right \|$ 是一个非负数，而最终我们判断类别仅仅考虑正负号的情况，所以不用精确距离数值，只保留公式中影响正负的式子即可。可以再乘 $\left \| w \right \|$ 消掉，这样公式就变为了 $w^{T}x+b$

那么我们的预测模型就可以这样定义：

$\hat{y}=f(x)=sign(\sum_{i=1}^{D}w_{i}x_{i}+b)=sign(w^{T}x+b)$

根据数据集训练获得参数w和b，然后就可以对新的数据进行预测了，预测结果 $\hat{y}$ 范围为(-1,1)

这个模型我们就可以称之为感知机(Perceptron)

Cost Function

这样损失函数就很简单了，我们可以用 $w^{T}x+b$ 表示模型预测的距离信息，而实际数据的分类信息是y，我们让预测的 $\hat{y}$ 与实际的y相乘。

例如这样的示例，其中右下的样本它本身应该属于-1，但是我们的分类线把它划在了上面，即 $w^{T}x+b$ >0，那么相乘后结果<0。只有当预测的结果与实际值一致时，相乘后的结果才是非负数。

因此只要出现负数，就表明目前模型参数有损失，可以进行优化。

Optimization

怎么进行优化呢？

首先我们考虑优化的对象，在上面的分析中，预测值与实际值乘积<0表明预测错误，所以我们只对这部分进行优化即可。

即

不过，这里有一个问题呀，为什么w的优化公式是

$w=w-\eta \left ( -y^{\left ( i \right )}x^{\left ( i \right )} \right )$ 这样的呢？

在上一章《线性回归》中我们也用了这样的梯度下降的优化方法，感觉这样的公式是偏直觉的，好像看着很有道理，但是具体的原理是怎么样的呢？

我们要先明白这里为什么梯度是 $-y^{\left ( i \right )}x^{\left ( i \right )}$ ，前面加负号的原因是什么？

很显然，在该模型中选取的损失函数为

而只有该函数小于0的时候才说明预测结果失败，因此我们选取的都是该损失函数小于0的部分，那么假设损失函数为l(w,b)，在优化的时候有l(w,b)<0，一般情况下我们习惯用正数表示损失函数值，所以令L(w,b)=-l(w,b)就有了>0，这样对L函数求w的偏导会得到 $-y^{\left ( i \right )}x^{\left ( i \right )}$

至于整个式子，偏导数表示损失函数在 w方向上的局部变化率，即损失函数在当前点w的增长方向。-偏导数则为当前点w的减少方向，所以 $w=w-\eta \left ( -y^{\left ( i \right )}x^{\left ( i \right )} \right )$ 这样更新w可以不断地减少损失函数值，从而达到优化的效果。

作业

数据集格式样式为：

共50行3列数据，前两列为横纵坐标，最后一列为该样本所属的类别。

需要完成的任务如图所示：

我们需要在update优化函数中，填写W和J的更新方法。

填写如下：

这里的Z实际上为 $\hat{y}$ ，即预测的类别，然后让Z矩阵中的元素与实际类别y相乘，对于大于0的部分更改为0（说明该部分预测正确）。剩下的就是预测错误的样本，接着就对这部分样本进行优化。

我们选取的优化策略为梯度优化，由于之前的损失为负数，所以这里-X.T@Y有一个-号。

迭代次数，学习率设置如下：

最后的结果为：

博客等级

码龄4年

29
原创

294
点赞

245
收藏

211
粉丝

关注

私信

热门文章

分类专栏

最新评论

爬取百度图片
总有一天942: 点赞已关注！大佬有时间能不能再出一个视频的
你可以安排的最多任务数目
CSDN-Ada助手: 恭喜您写了第13篇博客！不断更新内容是非常了不起的，希望您能继续保持这个势头。关于“你可以安排的最多任务数目”这个话题，或许可以考虑扩展到如何高效地安排任务，或者分享一些个人经验和技巧。期待您的下一篇作品！加油！
最近的请求次数
CSDN-Ada助手: 恭喜您在博客上发表了第14篇文章！持续创作是非常了不起的事情，您的坚持和努力一定会得到回报。建议在接下来的创作中，可以尝试深入研究最近请求次数的相关领域，探讨一些实际案例或者技术原理，让您的读者能够更深入地了解这个主题。期待您更多精彩的文章！祝您创作愉快！
快速排序回顾
CSDN-Ada助手: 恭喜您写了第15篇博客《快速排序回顾》，内容丰富，观点独到！持续创作是提升自己的最好方式，希望您能保持这样的热情，继续分享您的见解和经验。或许在下一篇博客中，可以探讨一下其他常用的排序算法，或者结合实际案例来展示快速排序的应用场景，让读者更好地理解和运用这一算法。期待您的下一篇作品！愿您越写越好，不断进步！
数组中的第k个最大元素
CSDN-Ada助手: 恭喜您发布了第16篇博客《数组中的第k个最大元素》，阅读了您的文章，观点独到，深入浅出，让人受益匪浅。希望您能继续保持写作的热情和创作的激情，不断提升自己的写作水平。下一步，建议可以多尝试一些实际案例的分析，或者探讨一些新颖的算法思路，相信会有更多读者受益。期待您更多精彩的作品，加油！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。