基于深度学习的目标检测方法

本文作者Ben Dickson
这篇文章是“分解人工智能”的一部分,这是一系列探讨人工智能应用程序如何工作的细节(与文件空间合作)的文章。
深度神经网络因其处理视觉信息的能力而出名。在过去的几年里,它们已经成为许多计算机视觉应用程序的关键组成部分。
神经网络可以解决的关键问题之一是在图像中检测和定位对象。对象检测被用于许多不同的领域,包括自动驾驶、视频监控和医疗保健。
在这篇文章中,我将简要回顾帮助计算机检测对象的深度学习架构。
卷积神经网络(CNN)
大多数基于深度学习的计算机视觉应用的关键组成部分之一是卷积神经网络(CNN)。CNN由深度学习先驱Yann LeCun于20世纪80年代发明,是一种能有效捕捉多维空间中模式的神经网络。这使得CNNs特别适合于图像,尽管它们也被用于处理其他类型的数据。(为了关注视觉数据,我们将在本文中考虑卷积神经网络是二维的。)
每个卷积神经网络都由一个或几个卷积层组成,这是一个从输入图像中提取有意义的值的软件组件。每个卷积层都由几个滤波器组成,矩阵滑过图像并在不同位置注册像素值的加权和。每个滤波器都具有不同的值,并从输入图像中提取不同的特征。卷积层的输出是一组“特征贴图”。
当相互堆叠时,卷积层可以检测到视觉模式的层次结构。例如,下层将生成垂直和水平边缘、角和其他简单模式的特征贴图。下一层可以检测到更复杂的模式,如网格和圆。当你深入网络时,这些层会检测到复杂的物体,如汽车、房屋、树木和人。

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值