机器学习基石notes-Lecture2 Learning to Answer Yes/No

感知机模型

对于一组特征向量 X=(X1,X2,,Xd) y:+1,1 ,将特征向量与权值向量做内积,其计算结果与阀值作比较进而输出结果

hH

h(X)=sign((i=1dWiXi)threshold)=sign(i=1dWiXi)+(threshold)W0(+1)X0=sign(i=0dWiXi)=sign(WTX)

例:在二维空间中,h函数表示为 h(X)=sign(W0+W1X1+W2X2)
二维空间感知机模型
空间中的点表示特征向量,标签y表示输出值,O表示+1,x表示-1,空间中的线表示假设

感知机学习算法

通过不断修正的方式,初始化的 W0 ,通过 D 训练样本不断修正。

具体算法:

t=0,1, 循环过程中

  1. 存在 (Xn(t),yn(t)) Wt 的规则下是错误的,即 sign(WTtXn(t))yn(t)

  2. 通过 Wt+1Wt+yn(t)Xn(t) 进行修正

  3. 直到没有错误返回 W g

感知机算法修正示意图

实际上W即为分割线的法向量,sign即为X在W方向上的分量与W是同向还是反向。

感知机算法的收敛性

PLA数据线性可分

假设 D 是线性可分的,那么PLA是否一定会停止

非线性可分数据集

但是PLA的前提是指导数据集是线性可分的

数据集中普遍存在噪声

解决办法

找一个在已知数据集上犯错最少的线

初始化当前最优预测向量 W^ ,在 t=0,1, 循环过程中

  1. 存在 (Xn(t),yn(t)) Wt 的规则下是错误的

  2. 通过 Wt+1Wt+yn(t)Xn(t) 进行修正

  3. 如果新的 Wt+1 W^ 犯的错少,跟新 W^ Wt+1

  4. 直到做了足够多次循环,返回 W^ g

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值