《机器学习基石》台大林轩田_学习笔记02_Learning to Answer Yes/No

猫哆哩o0

于 2017-10-15 15:17:41 发布

阅读量436

点赞数

分类专栏：机器学习机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_20513027/article/details/78240991

版权

机器学习同时被 2 个专栏收录

12 篇文章 0 订阅

订阅专栏

9 篇文章 0 订阅

订阅专栏

Lecture 2: Learning to Answer Yes/No

文章目录

- Lecture 2: Learning to Answer Yes/No

https://www.cnblogs.com/xbf9xbf/p/4571811.html

1 Perceptron Hypothesis Set

perceptrons 感知机<=>linear(binary) classifiers 线性分类器
For $\textbf{x}=(x_1,x_2,...,x_n)$
$Y:{+1,-1}$
$h(\textbf{x})=sign((\sum_{i=1}^{n} w_ix_i)-\theta) =sign(\sum_{i=0}^{n} w_ix_i) =sign(\textbf{w}^T\textbf{x})$

2 Perceptron Learning Algorithm（PLA）

知错能改算法
感知机学习策略的几何意义：表示超平面法向量的旋转方向
在这里插入图片描述
【注】每次都会根据一个错分类的样本进行调整，但是一次调整后并不能保证这个点一定能正确分类
（以 $y_i=+1$ 为例，若 $w_t$ 向量很长， $x_i$ 很短，且 $w_t$ 与 $x_i$ 的夹角特别大，那么就可能出现 $w_t+y_ix_i$ 之后还是不能保证 $w_{t+1}x_i$ 是正的，也就是夹角转不过来）
具体描述如下：
假设样本 $i$ 被错分类，则 $y_i w_t^Tx_i<0$
更新权重后 $y_i w^T_{t+1}x_i=y_i (w_t+y_ix_i)^T x_i =y_iw^T_tx_i +y_i^2x_i^Tx_i$
虽然后面一项是大于0的数，但如果 $|y_iw^T_tx_i |>|y_i^2x_i^Tx_i|$ ，该样本还是被错误分类的

3 Guarantee of PLA

找到一条线，使得没有错分类的时候，算法停止。
数据必须线性可分（linear separable）

首先假设数据是线性可分的，在此条件下，我们认为存在一个理想的超平面法向量 $w f$
我们认为 $w$ 越接近 $w_f$ 越好
认为向量的内积越大，越接近（夹角越小）<但是也要考虑长度>

上图证明了感知机算法可以保证权重每次更新都会更加接近 $w_f$
权重每次更新，长度也会发生变化，下图证明了权重的长度增长速度是有上限的
因此可证明经过一定次数的迭代，算法策略是收敛的。即证明下图式子：
证明思路：
1） $w_f$ 和 $w$ 的内积会越来越大
2） $w$ 的长度每次增幅有限
具体证明如下：

感知机的优缺：
优点：简单易实现、快速，可用于任意维度
缺点：需要假设数据集必须线性可分；不知道感知机多久才会停

4 Non-Separable Data

可能存在以下情况：数据本身线性可分，但是因为有噪声导致线性不可分
对于非线性可分的问题，找到一个超平面，错分类数最少（NP-hard）

解决办法
Pocket Algorithm：每次迭代都保留分类效果最好的权重。经过多次迭代后，逼近最优超平面。

若对于一个确实线性可分的数据，采用pocket algorithm比PLA算法更慢，因为每次迭代都需要对所有数据进行比较，选出更好的超平面。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

猫哆哩o0 CSDN认证博客专家 CSDN认证企业博客

码龄10年

49: 原创

19万+: 周排名

219万+: 总排名

5万+: 访问

: 等级

1075: 积分

22: 粉丝

20: 获赞

8: 评论

112: 收藏

私信

关注

热门文章

分类专栏

机器学习 9篇
机器学习 12篇
算法 9篇
统计学习 5篇
DFS 2篇
NYOJ 1篇
模式识别 1篇
python算法 2篇
区块链 5篇
技术修炼 1篇

最新评论

【区块链-以太坊】5 Ubuntu下truffle & ganache安装及使用
ASHLL26: 请问一下报错这个该怎么解决呀，感谢！！parallels@ubuntu-linux-22-04-desktop:~/Downloads$ sudo ./ganache-2.5.4-linux-x86_64.AppImage ./ganache-2.5.4-linux-x86_64.AppImage: 1: �: not found ./ganache-2.5.4-linux-x86_64.AppImage: 2: }�P7pys�H��_f��h: not found ./ganache-2.5.4-linux-x86_64.AppImage: 1: �b�@@: not found ./ganache-2.5.4-linux-x86_64.AppImage: 1: ELFAI: not found ./ganache-2.5.4-linux-x86_64.AppImage: 19: Syntax error: Unterminated quoted string
【区块链-以太坊】5 Ubuntu下truffle & ganache安装及使用
weixin_46036741: 想问一下现在的可视化界面，应该下载哪个呀，找不到image结尾的
【区块链-以太坊】5 Ubuntu下truffle & ganache安装及使用
王高兴啊: 感恩！！！！！！！！！！！！！！！！我今天装truffle装的快哭了，翻了好久是你救了我！！！！！！爱您
Mac下安装LaTeX——MacTeX + Sublime Text + Skim
SSSAN值狂掉: 成功了，谢谢博主
【区块链-以太坊】5 Ubuntu下truffle & ganache安装及使用
Rocky xD: 你好，为什么我用centos安装truffle，命令为 npm install -g truffle之后，一直没有成功，卡在npm http*****那里。还有，我安装图形界面的ganache时，双击下载的appImage文件，一直是没有为可执行文件文件类型安装程序。希望博主有时间可以帮我解答一下，QQ1048799927，谢谢。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。