神经网络算法 - 一文搞懂CNN（卷积神经网络）

最新推荐文章于 2024-08-23 14:39:57 发布

AI大模型探索者

最新推荐文章于 2024-08-23 14:39:57 发布

阅读量1.8k

点赞数 32

文章标签：神经网络算法 cnn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_53880910/article/details/140921827

版权

前言

本文将从CNN解决了什么问题、人类的视觉原理、CNN的基本原理、典型的CNN及实际应用四个方面，带您一文搞懂卷积神经网络CNN。

一、CNN解决了什么问题

图像处理存在两个难题：

数据量巨大： 图像由像素组成，每个像素又由RGB三个颜色参数表示。

对于一张1920×1080 像素的图片，就需要处理6百万个参数。（1920*1080*3=6220800）
特征保留困难： 传统图像处理方法很难保留原始图像特征。例如：图像中物体的位置发生变化，传统方法处理后的数据会有很大差异。

CNN解决问题：

提取特征： 卷积操作提取图像特征，如边缘、纹理等，保留图像特征。
数据降维： 池化操作大幅降低参数量级，实现数据降维，大大减少运算量，避免过拟合。

二、人类的视觉原理

在我们了解 CNN 原理之前，先来看看人类的视觉原理是什么？

1981年诺贝尔医学奖：

获得者：David Hubel（大卫·休伯尔）、Torsten Nils Wiesel（托斯坦·威泽尔）、Roger Sperry（罗杰·斯佩里）
主要贡献：发现了视觉系统的信息处理，可视皮层是分级的。

人类视觉原理：

光信号感知：原始信号摄入，光信号转化为神经信号。
初级视觉处理：神经信号传送到大脑的初级视觉皮层，进行初步特征提取，例如边缘、纹理等。
高级视觉处理：初级视觉皮层的信息传递到高级视觉皮层，进行复杂的特征提取，例如颜色、形状、运动等。
识别与认知：将输入的图像与已有的知识进行匹配和识别。

三、CNN的基本原理

构成部分：

卷积层： 用来提取图像的局部特征。
池化层：用来大幅降低参数量级，实现数据降维。
全连接层： 用来输出想要的结果。

基本原理：

卷积层：通过卷积核的过滤提取出图片中局部的特征，类似初级视觉皮层进行初步特征提取。

使用一个过滤器（卷积核）来过滤图像的各个小区域，从而得到这些小区域的特征值。

池化层：下采样实现数据降维，大大减少运算量，避免过拟合。

原始是20×20的，进行下采样，采样为10×10，从而得到2×2大小的特征图。

全连接层：经过卷积层和池化层处理过的数据输入到全连接层，得到最终想要的结果

四、典型的CNN及实际应用

典型的 CNN 并非只是上面提到的3层结构，而是多层结构。

例如，LeNet-5被誉为是卷积神经网络的“Hello Word”。LeNet-5是图灵奖获得者Yann LeCun（杨立昆）在1998年提出的CNN算法，用来解决手写识别的问题。

LeNet-5 的网络结构：

输入层：INPUT
三个卷积层： C1、C3和C5
两个池化层： S2和S4
一个全连接层： F6
输出层：OUTPUT

输入层- 卷积层 – 池化层- 卷积层 – 池化层 – 卷积层 – 全连接层 - 输出层

实际应用：

图像分类：可以节省大量的人工成本，将图像进行有效的分类，分类的准确率可以达到 95%+。典型场景：图像搜索。
目标定位：可以在图像中定位目标，并确定目标的位置及大小。典型场景：自动驾驶。
目标分割：简单理解就是一个像素级的分类。典型场景：视频裁剪。
人脸识别：非常普及的应用，戴口罩都可以识别。典型场景：身份认证。

最后

感谢你们的阅读和喜欢，我收藏了很多技术干货，可以共享给喜欢我文章的朋友们，如果你肯花时间沉下心去学习，它们一定能帮到你。

因为这个行业不同于其他行业，知识体系实在是过于庞大，知识更新也非常快。作为一个普通人，无法全部学完，所以我们在提升技术的时候，首先需要明确一个目标，然后制定好完整的计划，同时找到好的学习方法，这样才能更快的提升自己。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

一、全套AGI大模型学习路线

AI大模型时代的学习之旅：从基础到前沿，掌握人工智能的核心技能！

二、640套AI大模型报告合集

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

四、AI大模型商业化落地方案

五、面试资料

我们学习AI大模型必然是想找到高薪的工作，下面这些面试题都是总结当前最新、最热、最高频的面试题，并且每道题都有详细的答案，面试前刷完这套面试题资料，小小offer，不在话下。
在这里插入图片描述

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

AI大模型探索者

关注

32
点赞
踩
27

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。