深度学习在计算机视觉中应用综述

最新推荐文章于 2024-07-28 08:11:01 发布

Vinicier

最新推荐文章于 2024-07-28 08:11:01 发布

阅读量1.1w

点赞数 3

分类专栏：机器学习深度学习文章标签：计算机视觉深度学习机器学习卷积神经网络 cnn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010976453/article/details/54411154

版权

本文概述了计算机视觉的发展，重点介绍了深度卷积神经网络（CNN）在其中的重要作用。从生物神经网络到人工神经网络，再到CNN的结构与功能，如卷积层、非线性激活和池化层。深度学习通过CNN实现了从底层像素到高层特征的层次抽象，尤其在人脸识别领域的应用表现出卓越性能。

摘要由CSDN通过智能技术生成

前言

注意！注意！注意！本文是针对中国科学院计算所山世光教授于2017年1月7日于北京师范大学所做的《深度学习在计算机视觉中的应用与前景》讲座的内容总结梳理。

1 视觉智能的内涵

计算机视觉系统的任务就是像人一样描述摄像机拍摄到的内容。

常见的视觉任务：

距离估计
目标检测与跟踪
物体分割
目标识别
内容理解

下图所示就是计算机视觉任务中的物体识别的一个例子，如单一物体（图中猫）的识别，或多物体的识别（如图中的狗、猫和鸭子等的识别）。

从2012年到2016年，计算机视觉经历了跨越式发展。在ImageNet ILSRVRC 图像分类上 1000类Top5错误率：26%-> 3.6%。

2 视觉跨越式发展源于深度卷积网络CNN

2.1 计算机视觉的基本任务

针对待检测图片，识别出图片中的目标物体对象；
对图片内容进行理解，实现图片的语义分割。

处理的流程图如下：

2.2 深度学习的起源——生物神经网络

深度学习的基本原理是“加权投票模型”，它来源与生物神经学系统中的神经元系统的启示。

如图所示，生物学中，一个完成的神经元主要包括轴突和树突两大部分，神经信号的传递主要是轴突的神经末梢受体释放后经过突触间隙被树突的受体捕获，产生电位传递给胞体。胞体将获得的电信号进行汇总给出决策：产生激励信号或者抑制。

最后整个大脑的决策就是所有神经元信号的加权投票决策。

2.3 人工神经网络

正是受到生物神经网络的启发，我们在计算机中构建人工神经网络模型。

2.3.1 单一神经元模型

加权求和（卷积）+ 非线性激活函数

如图所示，我们的输入信号 $x_1,x_2, \cdots,x_n$ 可以看作是神经元中来自其他神经元轴突的信号，对应的 wk1,w

最低0.47元/天解锁文章

关注

3
点赞
踩
43

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Vinicier CSDN认证博客专家 CSDN认证企业博客

码龄11年

20: 原创

17万+: 周排名

229万+: 总排名

39万+: 访问

: 等级

1873: 积分

393: 粉丝

335: 获赞

57: 评论

1317: 收藏

私信

关注

热门文章

分类专栏

最新评论

高光谱遥感图像相关知识梳理大全
许淇: 请问博主，对于获得的初始图像。进行辐射校正几何校正噪声去除之后。是先降维，还是先进行光谱解混呢？它们之间有没有什么联系？
机器学习中的线性代数之矩阵求导
日拱一卒不慌忙: 为什么维度分析的时候要用分母布局啊？什么时候用分子，什么时候用分母？
机器学习中的线性代数之矩阵求导
日拱一卒不慌忙: 分子布局：分子的行数决定行，分母的列数决定列，分母布局相反
机器学习中的线性代数之矩阵求导
日拱一卒不慌忙: 有点越看越晕，建议先看评论
机器学习中的线性代数之矩阵求导
一米七八_FZH: 前面说 “所以本文中我们采用的是分子布局” 。到第四条，维度分析的时候用的是分母布局吧。一开始没反应过来，呜呜。

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。