研究 | YOLO 一眼就能认出你:看一个神经网络如何全视野实时检测目标

作者 | Joseph Redmon的 & Ali Farhadi

编译|AI100(rgznai100)

作者 | Joseph Redmon的 & Ali Farhadi

编译|AI100(rgznai100)

YOLO全名You only look once(你只需要看一眼),是一个用于摄像头的实时目标检测系统。它能分辨出6000种物体,可在Titan X显卡上以40-90FPS的帧率处理视频。

007跑得再快,它看上一眼也能记住:

YOLO的作者是华盛顿大学(保罗·艾伦母校)的Joseph Redmon和保罗·艾伦AI研究所的Ali Farhadi,该项目目前已经开源,代码用C和CUDA写成,还有训练好的参数供你下载。

YOLO在原理上不同于过往的目标检测系统,人们过去只是把分类器和定位器的模型重用到目标检测上,用以监控摄像头视野中的多处位置和区域,得分最高的区域就被认为是发现目标。

YOLO的神经网络则可以监控摄像头的整个视野,如下图所示,它把整个视野的图像分成13×13的方格细胞:

每个方格细胞负责预测5个目标框,并以目标框来描述神经网络所检测到的物体:

不过,YOLO所输出的置信度数值,并非针对它所要识别的目标,而是目标框形状的契合程度。置信度越高,目标框就越粗:

目标框确定后,方格细胞便据此来预测目标的分类。以PASCAL VOC图像数据集为例,YOLOh很轻松就能辨别出20种不同的目标:自行车、船、汽车、猫、狗、人……

与基于分类器的老式系统不同,YOLO仅运行一个神经网络就能实时检测目标,相比要运行数千个神经网络才能检测目标的R-CNN系统,它能快上1000倍。

YOLO项目的详细信息如下:

参考内容:

htt

github.com/pjreddie/da…

p://machinethink.net/blog/object-detection-with-yolo/


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值