吴恩达机器学习神经网络 8-1非线性假设

Non-linear hypotheses 非线性假设

神经网络实际上是一个相对古老的算法,但是后来沉寂了一段时间,不过现在,它又成为许多机器学习问题的首选技术。

为什么要研究神经网络?

这是一个监督学习分类的例子 ,如果用logistic回归来解决这个问题,可以构造一个包含很多非线性项的Logistics回归函数。当只有两个特征,比如X1、X2时,这种方法确实能得到不错的结果,因为你可以把X1和X2的所有组合都包含到多项式中,但许多有趣的机器学习问题的特征项远不止两项。假设我们有非常多的特征,例如大于100个变量,我们希望用这100个特征来构建一个非线性的多项式模型,结果将是数量非常惊人的特征组合,即便我们只采用两两特征 (x_{1}x_{2}+x_{1}x_{3}+x_{1}x_{4}+...+x_{2}x_{3}+x_{2}x_{4}+...+x_{99}x_{100})的组合,我们也会有接近5000个组合而成的特征。这对于一般的逻辑回归来说需要计算的特征太多了。

下面是关于计算机视觉中的一个问题,假设你想要用机器学习的办法来训练一个分类器,来检测图像,来判断图像是否为一辆车。

 

计算机视觉就是根据像素点亮度矩阵来告诉我们这些数值代表一个汽车门把手。

当我们用机器学习算法构造一个汽车识别器时,我们要做的就是提供一个带标签的样本集,其中一些样本是各类汽车,另一部分样本不是车,将这个样本集输入给学习算法,以训练出一个分类器,然后我们进行测试,输入一副新的图片,让分类器判断这是什么东西。理想情况下,分类器能识别出这是一辆汽车。

 

为了理解引入非线性假设的必要性,我们从学习算法的训练样本中找出一些汽车图片和一些非汽车图片,从图片中选一组像素点位置,在坐标系中标出这幅汽车的位置,车的位置取决于像素点1和像素点2的强度。

 用同样的方法处理其他图片,用+表示汽车图片,用-表示非汽车图片,可以发现他们分布位置不同,因此我们需要一个非线性假设来尽量分开这两类样本。

 

假使我们采用的都是50x50像素的小图片,并且我们将所有的像素视为特征,则会有 2500个特征,如果我们要进一步将两两特征组合构成一个多项式模型,则会有约 2500^2 / 2个(接近3百万个)特征。普通的逻辑回归模型,不能有效地处理这么多的特征,这时候我们就需要神经网络

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值