machine learning学习笔记<二>

最新推荐文章于 2022-04-29 10:40:49 发布

yao1131

最新推荐文章于 2022-04-29 10:40:49 发布

阅读量307

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yao1131/article/details/77862271

版权

机器学习专栏收录该内容

9 篇文章 0 订阅

订阅专栏

感知器

这里写图片描述

我们从一张图说起，如上图所示，我们想要用一条直线把二维平面中的圆圈和×两个不同类别的符号分离开来。每个圆圈和×的坐标都用

(x1,x2) $(x_1,x_2)$ 来表示，而我们想要画的直线的表达式就是h(x)所示。其中

x1,x2 $x_1,x_2$ 为已知样本，剩下要求的就是权重值

wi $w_i$ 了。函数sign是这样定义的，sign(x)=1,if x

≥ $\geq$ 0;sign(x) = -1,ifx<0.既然我们要用sign函数来分类，那对应每个样本要有个标签label，这样我们才知道自己求出的直线对不对。圆圈对应label为1，我们简称正样本，×对应label为-1，我们简称负样本。此外，我们定义这个感知器的假设空间为

xn $x_n$ >0.
首先，初始化

wT $w^T$ =0,将各个权重系数归零。
第二步，用初始化的

wT $w^T$ 对各个样本进行求解，看sign(

w0+w1∗x1+w2∗x2 $w_0+w_1*x_1+w_2*x_2$ )的结果和对应的label完全符合，这个地方显然只有正样本的label是对的。
第三步，对于错误的样本总是有

yn∗x<0 $y_n*x<0$ ,为了让我们的直线更好的对数据进行分类，必须对其权重进行更新,更新公式：

Wi+1=Wi+η∗yn∗Xn,其中Xn,Wi,Wi+1都是三维的向量，η $W_{i +1}=W_i + \eta*y_n*X_n,其中X_n,W_i,W_{i+1}都是三维的向量， \eta$ 为更新步长可以自己设置。
就这样一步步的迭代直到得出一条完美的曲线。这是对于线性可分的情况，如果已知距离原点最远样本

R2=max||xn||2,和ρ=minyn∗wTf||wf||∗xn，其中wf为理想的直线权重系数 $R^2 = max||x_n||^2,和\rho = miny_n*\frac{w_f^T}{||w_f||}*x_n，其中w_f为理想的直线权重系数$ 。那么需要迭代的次数小于等于

R2ρ2 $\frac{R^2}{\rho^2}$ 。
那对于线性不可分的情况呢？也就是说，如下图这种情况。

这里写图片描述

这里写图片描述

这个时候就要相对多的次数去迭代，看直线最终收敛到什么情况。只有一个相对最优，不可能完全划分的。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
machine learning学习笔记<二>

感知器我们从一张图说起，如上图所示，我们想要用一条直线把二维平面中的圆圈和×两个不同类别的符号分离开来。每个圆圈和×的坐标都用(x1,x2)(x_1,x_2)来表示，而我们想要画的直线的表达式就是h(x)所示。其中x1,x2x_1,x_2为已知样本，剩下要求的就是权重值wiw_i了。函数sign是这样定义的，sign(x)=1,if x≥\geq0;sign(x) = -1,ifx<0.
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。