CNN---李宏毅《机器学习》笔记06

本文详细介绍了CNN(卷积神经网络)在机器学习中的重要性,通过鸟嘴检测的例子阐述其减少参数的需求,讲解了CNN的架构,包括Convolution、Max Pooling和Flatten等关键步骤,并探讨了Deep Dream和Deep Style的应用,最后讨论了CNN在围棋和语音文本处理等领域的应用。
摘要由CSDN通过智能技术生成


一、为什么要使用CNN?

  1. 全连接前馈网络做影像处理时需要太多参数
  2. 用power knowledge 把其中一些参数拿掉就变成了CNN

以鸟为例子

  1. Small region:假设有一个neural的工作是要侦测有没有鸟嘴的存在,那只需要给neural看一小方框的区域(鸟嘴),判断它是不是一个鸟嘴,不需要去看整张图。所以,每个neural连接到每一个小块的区域就好了,不需要连接到整张完整的图。
  2. Same Patterns:对于不同位置的鸟嘴,不需要专门训练不同的detector,可以用同一组参数,从而减少需要的参数的量。

在这里插入图片描述
3. Subsampling:把一个image的奇数行,偶数列的pixel拿掉,变成原来十分之一的大小,它其实不会影响人对这张image的理解

二、CNN的架构

  1. 基于上述三个观察设计出CNN的架构如下,前两个用convolution处理,最后一个可以用Max Pooling处理
    在这里插入图片描述

三、Convolution

  1. Small region:
    在这里插入图片描述
  2. Same Patterns:
    从左上角开始,一次移动一步,从66的matrix得到44的matrix
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
  3. convolution和fully connected之间的关系:首先是拿掉了weight(shared weight)
    在这里插入图片描述

四、Max pooling

  1. 根据filter1得到一个4*4矩阵后,把四个value合成一个value,减小image
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

五、Flatten

  1. 就是把feature map 拉直,然后丢到全连接前馈网络里。
    在这里插入图片描述

六、Deep Dream和Deep style

  1. Deep Dream就是让CNN夸大化它所看到的东西
    在这里插入图片描述
  2. Deep style:input一张image,让machine修改这张图,让它有另外一张图的风格
    在这里插入图片描述

七、CNN应用

  1. 围棋:找一个function,input棋盘,output是下一步要下在棋盘上的哪里。
  2. 语音和文本:把声音、文字变成图像来处理在这里插入图片描述
    在这里插入图片描述
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值