【李宏毅机器学习2021】Task05 网络设计的技巧

最新推荐文章于 2024-07-22 09:16:52 发布

王多头发

最新推荐文章于 2024-07-22 09:16:52 发布

阅读量836

点赞数

文章标签：机器学习人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/QAQterrible/article/details/127418773

版权

【李宏毅机器学习2021】本系列是针对datawhale《李宏毅机器学习-2022 10月》的学习笔记。本次是对深度学习中卷积神经网络的总结。本节课主要讲解卷积神经网络中的感受野、滤波器、下采样的重要组成部分。网络设计技巧在之前内容已经介绍过，本次就打卡卷积神经网络啦。

目录

卷积神经网络

alphago上的应用

卷积神经网络

任务介绍

卷积神经网络的主要目标是做图像分类，针对图像上的特征进行区分定位。

这里可能会遇到说RGB三个颜色怎么进行处理

可以将三个通道的图像拉成一个长矩阵。如果像之前的全连接网络对图像处理由于参数过大，会导致overfitting问题。

需要针对图像这种特征明显且数据量大的输入做更好的预测，从而诞生了cnn。

感受野

对于图像的分类，如果找到图片内的响应特征，只用这些特征就可以很容易定位到图像类别。

通过这个方式思考，可以用专门的神经元去筛选图像中的特征。这样的神经元尺寸一般是3*3的矩阵，这样的矩阵叫kernel。

矩阵对图像筛选特征时，在最后一列可能不足需要补充像素点。这里用到的方法叫padding

使用kernel对图像处理时每次将kernel移动的位置叫stride。

滤波器

对于相同的特征在不同的图像可能是不同的位置，所以对于同一特征需要在整个图像上处理查找。

处理的方式就是让不同的神经元去共享参数处理图像，例如下图。

换个方式讲，就是用3*3*channel的滤波器（矩阵）对图像处理，将滤波器上的值和图像上的点相乘后求和。得到一个尺寸更小的矩阵，同时深度更深，因为用到很多滤波器，这样的矩阵叫feature map。

注意：如果做两次3*3的卷积，其实相当于对图像做5*5的处理，并不是无效操作。

下采样

有的时候图像中的信息已经很丰富，可以进行压缩处理。对图像中分成由相同大小组成的矩阵。

通过一定的规则，如取小矩阵中最大值作为新图像的点。

一般卷积和poolling的方法一般会组合使用。

整个cnn网络如下

alphago上的应用

下围棋其实就是一个分类任务，有19*19类。

围棋任务中有很多和图像处理相似的点。比如这样5*5的矩阵就是一个特征。同时这样的特征可以分布在棋盘很多位置。

不同点就是不需要pooling 不然会打乱围棋特征。这里也映射出来一个道理，设计的神经网络架构需要贴切实际任务本身，不然会丢失很多信息。

网络缺陷

cnn网络缺陷就是fliter在图像中的大小是一致的，筛选的特征也是一定尺寸的。如果图像放大或缩小特征就会丢失，不匹配。这种问题就需要在使用cnn网络之前就对图像做扩展，放大、缩小、旋转相应的操作。

不过目前大火的transformer网络可以很好的解决这个问题。

学习结束~行百里者半九十，继续加油。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【李宏毅机器学习2021】Task05 网络设计的技巧

本次是对深度学习中卷积神经网络的总结。本节课主要讲解卷积神经网络中的感受野、滤波器、下采样的重要组成部分。网络设计技巧在之前内容已经介绍过，本次就打卡卷积神经网络啦。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。