林轩田之机器学习课程笔记( how can machines learn之linear models for classification)(32之11)

欢迎转载,可以关注博客:http://blog.csdn.net/cqy_chen

概要

上节课讲述了逻辑回归,分析了逻辑回归的损失函数,采用了梯度下降的方式来求解。这节进行了延伸。

通过线性模型进行二分类

线性模型我们知道有线性回归以及逻辑回归。我们将三者的损失函数进行变形,设定 s=wTx ,因为这个表示一个加权分数。
结果如下图:

这里写图片描述
将三者的损失函数画在图形上如下:
这里写图片描述
所以我们得到:

err0/1errsce=1ln2errcevcE0/1out(w)E0/1in(w)+......Escein(w)+......

所以呢,只要将数据采用逻辑回归得到一个比较小的值,那么就可以将二分类的损失函数降低,从而使得 E0/1out(w) 降低。
所以我们是可以使用逻辑回归或者线性回归来求解二分类的。
这样直接替换的麻烦就是上界被我们放大了。
这里写图片描述

所以我们一般是这样做:
1)使用线性回归初始化 w
2)然后采用逻辑回归求解二分类问题。

随机梯度下降

在PLA中,我们每次更新只看犯错误的点,而在逻辑回归的梯度下降中,每次更新需要计算梯度,而计算梯度是要计算中整个资料点的。能不能也让逻辑回归每次计算只看一个点呢?
原始的式子是

wt+1=wt+η1Nn=1Nθ(ynwTxn)(ynxn)

原来一堆数据的平均,我们通过随机一堆数据来平均进行代替。现在只抽取一个点,这个思想被称为随机梯度。
将真正的梯度作为随机梯度的期望。这两个应该是差不多的。
随机梯度=真实的梯度+0均值的一个噪音
随机梯度的好吃就是快,简单。采用随机梯度可以应用在大数据方面以及在线学习方面。现在深度学习基本都是采用随机梯度下降方法进行优化。
采用随机梯度的后,变更改为:

wt+1=wt+ηθ(ynwTxn)(ynxn)PLAwt+1=wt+1[ynsign(wTxn)](ynxn)

两者进行对比之后发现采用随机梯度的逻辑回归和PLA的更新方式貌似差不多嘛。当逻辑回归的 η=1 而且 wTxn 比较大的时候,就差不多了。
现在还有两个问题,
1)算法什么时候该停止,采用SGD没有办法说计算整个的梯度,所以呢,不好计算整个的梯度是否为0作为条件。一般情况下就是运行我们认为够多的次数。
2)算法的 η 该等于多少。这个没有明确的定义,一般采用0.1就差不多啦。

通过逻辑回归进行多分类

前面一直讲的是二分类,现在如何延伸到多分类的问题。
如下图所示,有四个类别,如何采用以前的二分类来进行多分类呢?
这里写图片描述
一种想法是将其中一种和其他几种分开。就是oneVSall
这样就得到如下的结果:
这里写图片描述
这样重复多次,就可以将各个类别分开。最后得到结果:
这里写图片描述
我们可以明显的看到:
1)中间的区域,貌似都不属于任何类别
2) 部分区域会有两个分类器都说是自己。
所以直接使用0/1分类就会导致这样的问题,那么如果采用逻辑回归来进行一个概率估计呢?前面我们也证明了逻辑回归是可以用来进行分类的。
得到结果如下:
这里写图片描述
所以这样就使用了逻辑回归进行了多分类。采用多个逻辑回归算法,然后给出每个算法在每个点的概率,认为最大的概率就是需要的结果。

采用了这样的方法进行多分类有一些其他问题:
1)每次分类的时候,是一个对多个,当类别很多的时候,会导致类别不平衡的问题,这个时候可以采用多类别的逻辑回归。
2)任意的类似逻辑回归的算法都可以用来进行分类。

多分类与二分类

上节讲到如果采用OVA这样的算法,会导致类别不平衡的问题,那如果采用一个类别和另一个类别进行计算呢?就是OVO算法。
如下图所示:
这里写图片描述
这里只提取菱形和方块的分类,不采用全部的数据量,只使用这两个类别的数据,就不会导致类别不平衡的问题。
最后结果如下:
这里写图片描述
这个时候就需要 C2n 个算法。最后进行预测的时候,通过投票的方式,多者胜出。貌似这样的方法还不错哟。

那么OVA 和OVO的区别有啥呢?
1)算法数量不一样,OVA远小于OVO的
2)OVA每次元运算都要全部资料, 而OVO只需要一部分资料,OVO一次训练更快。
3)预测的时候OVA更快,因为算法量少,OVO时间长
一般来说OVO还是比较稳定的。

欢迎转载,可以关注博客:http://blog.csdn.net/cqy_chen

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值