李宏毅机器学习与深度学习【2022版】 03

最新推荐文章于 2024-10-01 23:00:34 发布

撸码侠

最新推荐文章于 2024-10-01 23:00:34 发布

阅读量1.1k

点赞数 23

分类专栏：李宏毅机器学习与深度学习【2022版】文章标签：机器学习深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42830015/article/details/141499548

版权

李宏毅机器学习与深度学习【2022版】专栏收录该内容

3 篇文章 0 订阅

订阅专栏

文章目录

一、卷积神经网络CNN
二、使用验证集，模型还过拟合的原因
三、深度学习的优点
四、Spatial Transformer Layer

一、卷积神经网络CNN

CNN在影像识别中，表现比较好。
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
每个感受野 receptive field 都有一个神经元去探测鸟嘴，是没有没要的，所以可以共享它们的参数。

在这里插入图片描述

在这里插入图片描述
如果两个神经元在同一个感受野中，不能共享参数。因为它们的输入相同，参数也相同，将会导致输出也想通。

在这里插入图片描述
可以理解为在一个感受野中，每一个神经元提取一个特征。

在这里插入图片描述
共享的参数称之为filter。如图中，两个红色神经元共享的参数称之为filter 1。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
输入数据与卷积核做内积，得到的加过叫 Feature Map

在这里插入图片描述
每一个filter提取一种特征。

在这里插入图片描述
上图中，的第二层卷积形状为 $\times 3 \times 64$ ，是因为输入值有64个通道。

在这里插入图片描述
第二层卷积层的filter大小为 $\times 3$ ，它侦测第一层卷积层的范围就是 $\times 3$ ，而它实际侦测原图像的范围就是 $\times 5$ ，只要叠的层数够深，侦测的范围就会够大。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
Pooling不改变通道数，只是减小长宽。它主要是用来减少数据量的。并不是所有卷积层之后，都要接池化层，比如下围棋，所以需要根据情况，进行使用。

在这里插入图片描述
CNN没有对放大和旋转图片的不变性，所以我们需要data augmentation

二、使用验证集，模型还过拟合的原因

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
所以通常希望待选模型数量要少，训练集要大，就不容易过拟合。

三、深度学习的优点

深度学习可以两者兼顾
在这里插入图片描述

为什么我们想要网络更深，而不是更胖？

在这里插入图片描述
虽然一个隐层的网络可以表现任何函数，而参数量相同的情况下，瘦高的网络比胖短的网络表现更好。

在这里插入图片描述
类比剪纸，先折叠再剪，比直接剪，会少剪很多刀。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
达到相同的效果，深度学习需要更少的参数，进而需要更少的数据就可以避免过拟合。
如果目标函数，即可以是loss特别低的函数，是复杂有规律的，深的神经网络比胖的表现更好，例如在语音、影像上面的应用。

四、Spatial Transformer Layer

在这里插入图片描述
Spatial Transformer Layer作用就是将输入的image旋转变换为cnn认识的数据。当然它也可以transform cnn的feature map。

在这里插入图片描述

例如，如下图，连接箭头的起点的weight设置为1，其他都为0，这样就能完成旋转和平移的变换。
在这里插入图片描述

以下是该NN找出控制该连接的方法：

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
这里存在的问题是，在参数为非整数时，得到的 layer l-1 的索引值也是小数。如果简单地取离它最近的索引值，会造成参数的梯度总是为零。因为参数发生略微变化时，输出值： layer l-1 的索引值并不会变化，进而loss不会发生变化，所以梯度总是零，就没法训练优化。

解决方法：可以采用双线性插值法。
在这里插入图片描述

在这里插入图片描述
Localisation net： 就是输出变换矩阵的六个权重参数的神经网络。
Grid generator： 根据Localisation net计算的变换矩阵，实现像素点坐标的对应关系，即由目标图片的索引，计算得到原图片的索引。
Sampler： 对上一步算出的位置（即layer l-1 的索引值），进行双线性插值，得到最终输出。

应用举例如下：
在这里插入图片描述

关注

23
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

撸码侠 CSDN认证博客专家 CSDN认证企业博客

码龄6年

57: 原创

13万+: 周排名

2万+: 总排名

5万+: 访问

: 等级

1374: 积分

596: 粉丝

800: 获赞

18: 评论

925: 收藏

私信

关注

热门文章

分类专栏

最新评论

李宏毅机器学习与深度学习【2022版】 01
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
pytorch库 05 PyTorch深度学习实践笔记
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/619256028。
Python基础17 模块（6）常用标准库模块 logging、configparse、hashlib
北风之神c: 总结的很全面，写得赞，博主用心了。此国产日志 https://nb-log-doc.readthedocs.io/zh_CN/latest 使用原生 loggng封装，兼容性和替换性100%,大幅简化logging的使用。 1、日志能根据级别能够自动变彩色。 1 2、print自动变彩色。 3、日志和print在pycahrm控制台的输出都自动可以点击跳转到文件和行号。 4、多进程日志切割安全，文件日志写入性能高。 5、入参简单，能一键自动记录到多种地方。 6、 nb_log 兼容包含loguru色彩模式,loguru只是nb_log的子集之一. 相比 loguru 有10胜。 pip install nb_log 。
pytorch库 02 Anaconda、Jupyter常用命令及操作
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/619040443。
Pycharm安装sklearn后，仍然报错No module named ‘sklearn‘
J17337520068: 谢谢

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。