深度神经网络及目标检测学习笔记

这篇博客是作者关于深度学习,特别是深度神经网络(DNN)和卷积神经网络(CNN)的学习笔记。文章讨论了神经元模型、BP算法以及CNN的工作原理,如卷积运算、池化和典型CNN模型,如LeNet、AlexNet等。此外,还介绍了物体检测的重要性和相关算法,如R-CNN、YOLO系列,并指出YOLO在实时性上的优势。
摘要由CSDN通过智能技术生成

这是一段实时目标识别的演示, 计算机在视频流上标注出物体的类别, 包括人、汽车、自行车、狗、背包、领带、椅子等。

今天的计算机视觉技术已经可以在图片、 视频中识别出大量类别的物体, 甚至可以初步理解图片或者视频中的内容, 在这方面,人工智能已经达到了 3 岁儿童的智力水平。 这是一个很了不起的成就, 毕竟人工智能用了几十年的时间, 就走完了人类几十万年的进化之路,并且还在加速发展。

道路总是曲折的, 也是有迹可循的。 在尝试了其它方法之后, 计算机视觉在仿生学里找到正确的道路 (至少目前看是正确的) 。通过研究人类的视觉原理,计算机利用深度神经网络 (Deep Neural Network,NN)实现了对图片的识别, 包括文字识别、物体分类、图像理解等。在这个过程中,神经元和神经网络模型、大数据技术的发展, 以及处理器(尤其是 GPU)强大的算力, 给人工智能技术的发展提供了很大的支持。

本文是一篇学习笔记, 以深度优先的思路, 记录了对深度学习(Deep Learning)
的简单梳理,主要针对计算机视觉应用领域。

一、神经网络
1.1 神经元和神经网络
神经元是生物学概念, 用数学描述就是: 对多个输入进行加权求和, 并经过激活函数进行非线性输出。

由多个神经元作为输入节点,则构成了简单的单层神经网络(感知器) ,可以进行线性分类。两层神经网络则可以完成复杂一些的工作, 比如解决异或问题,而且具有非常好的非线性分类效果。而多层(两层以上)神经网络,就是所谓的深度神经网络。

神经网络的工作原理就是神经元的计算, 一层一层的加权求和、 激活,最终输出结果。深度神经网络中的参数太多(可达亿级) ,必须靠大量数据的训练来设置。训练的过程就好像是刚出生的婴儿, 在父母一遍遍的重复中学习 “这是苹果”、“那是汽车”。有人说,人工智能很傻嘛,到现在还不如三岁小孩。其实可以换个角度想: 刚出生婴儿就好像是一个裸机, 这是经过几十万年的进化才形成的,然后经过几年的学习,就会认识图片和文字了;而深度学习这个“裸机”用了几十年就被设计出来, 并且经过几个小时的 “学习”,就可以达到这个水平了。

1.2 BP 算法
神经网络的训练就是它的参数不断变化收敛的过程。 像父母教婴儿识图认字一样,给神经网络看一张图并告诉它这是苹果, 它就把所有参数做一些调整, 使得它的计算结果比之前更接近“苹果”这个结果。经过上百万张图片的训练,它就可以达到和人差不多的识别能力, 可以认出一定种类的物体。 这个过程是通过反向传播( Back Propagation,BP)算法来实现的。

建议仔细看一下 BP 算法的计算原理,以及跟踪一个简单的神经网络来体会训练的过程。

1.3 小结
人工神经网络就是根据人的神经元模型而构建的一个感知算法, 利用大量的神经元组合对人的认知行为进行拟合。 目前我们仍然无法精确的知道它为什么能工作、如何工作,如同我们仍然无法精确知道人的大脑是如何工作一样。在摸索过程中,我们好像应该更多地思考人类自己是怎么去“看”的,这会更有助于设计更好的算法。 比如本文开头的视频识别算法, 它很快,但是不够精确,而有些可以“看清”细节的算法,就会非常慢。就像我们人类自己,走马观花只能看到概貌,驻足观赏才能看清细节。我们越了解自己,就越能做得更好。

二、卷积神经网络
2.1 简介
卷积神经网络( Convocational Neural Network,CNN)是一个特殊的深层神经网络,目前在计算机视觉领域广泛使用, 可以认为它是一个二维向量 (图片就是一个二维向量)的感知器。

CNN 算法的核心是对图像(二维向量)进行矩阵卷积运算,这就相当于是对图像进行加权求和。为了减小计算量, CNN 采用了局部感知和权值共享的方法。局部感知,就是用一个 N×N(如 N

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值