深度学习计算机视觉从入门到精通——目标检测技术及常用数据集

深度学习计算机视觉从入门到精通——目标检测原理与深度实战
分享者:人工智能实验室:赵世智

一、概述及应用

目标检测概述

找出图像中所有感兴趣的目标,以矩形框的形式确定它们的位置和大小,并确定该目标的类别。

由于各类物体有不同的外观,形状,姿态,加上成像时光照,遮挡等因素的干扰,目标检测一直是机器视觉领域具有挑战性的问题。
目标检测应用
安防:人脸检测和手指检测,为人脸识别与指纹识别提供有效的区域。
交通:违章车辆检测,并检测提取相应的车牌号码;行人检测;自动驾驶。
游戏娱乐:微软,索尼体感游戏,结合手势检测,人脸检测等,接受玩家指令,进行互动。

医疗:CT,核磁图像的病变区域检测。

二、目标检测技术在数据堂的数据标注中的应用

能力:人体检测、车辆检测、交通灯检测
使用场景:筛选、计数、预标注
项目案例:
人体抠图与18关键点标注项目
监控视频数据过滤
监控视频数据车辆统计
效果:图像筛选准确率:60%以上
作用:降低原始数据筛选人工成本;降低标注单位人工成本

三、常用数据集

开源数据集:

ImageNet:http://image-net.org/
COCO(Common Objects in Context):http://mscoco.org/
Pascal VOC:http://host.robots.ox.ac.uk/pascal/VOC/
数据堂目标检测数据集:

209611框人脸检测数据
209611框监控场景下人脸检测数据。监控场景包括室内(商场、超市、地铁)和室外(街道),包含少数超密集场景。数据涵盖男性女性,年龄分布儿童至老人。在标注方面,标注人脸框。数据可用于人脸检测、属性识别等任务。

208785框人头检测数据
208785框监控场景下人头检测数据。监控场景包括室内(商场、超市、地铁)和室外(街道),包含少数超密集场景。数据涵盖男性女性,年龄分布儿童至老人。在标注方面,标注人头框。数据可用于人头检测、属性识别等任务。

223557框人体检测数据
223557框监控场景下人体检测数据。监控场景包括室内(商场、超市、地铁)和室外(街道),包含少数超密集场景。数据涵盖男性女性,年龄分布儿童至老人。在标注方面,标注人体检测框及人体状态属性。数据可用于人体检测、属性识别等任务。

9万张车辆图像及标注数据
该数据总计10,165 张,大车图片有 1,857 张,小车图片有 8,308 张,数据特点是车辆类型多样,8种车型,每张照片中只出现一辆车,干扰因素少,照片、车牌标注更加清晰;数据可用于车牌识别等任务。
……

四、评价指标

1、IoU(Intersection over Union)
2、基本概念
在这里插入图片描述
True Positive (TP):正样本被正确识别为正样本
True Negative (TN):负样本被错误识别为正样本
False Positive (FP):假的正样本,即负样本被错误识别为正样本
False Negative (FN):假的负样本,即负样本被正确识别为负样本

3、ROC曲线
4、PR(precision and recall)曲线

五、算法归纳

1、传统的目标检测
2、深度学习目标检测的开端R-CNN
3、历史进程
4、算法归纳——分类
总结:本期主要介绍目标检测的概述、应用、目标检测技术在数据堂的数据标注中的应用、目标检测常用的数据集、评价指标以及算法归纳。下期将对经典算法进行讲解,并对其使用的代码进行详解以及深度实践。

本文内容来自:数据堂——人工智能实验室

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值