目标检测和手势识别(笔记)

目录

   一.R-CNN    

  二.目标检测   

1.具体过程如下:

2.R-CNN基本工作流程:

3.R-CNN的优点与不足:

除此之外

 ———————————————————————————————

三.手势识别


 了解目标检测和手势识别代码后的收获

基于对卷积神经网络的了解,我进一步知道了R-CNN

   一.R-CNN    

        R-CNN的全称是Region-CNN,是第一个成功将深度学习应用到目标检测上的算法。R-CNN基于卷积神经网络(CNN),线性回归,和支持向量机(SVM)等算法,实现目标检测技术。

       传统的目标检测方法大多以图像识别为基础,R-CNN遵循传统目标检测的思路,同样采用提取框,对每个框提取特征、图像分类、 非极大值抑制四个步骤进行目标检测。只不过在提取特征这一步,将传统的特征(如 SIFT、HOG 特征等)换成了深度卷积网络提取的特征。

  二.目标检测   

这里进行了一段代码来看看目标检测的运行。

1.具体过程如下:

                1.首先用Visual Studio Code将文件打开

2.然后将解压出来的文本yolox_tiny.pth放入yolox-pytorch-main\model_data中

3.接着修改程序中部分文件的路径

4.最后ctrl+f5运行程序 

可以看到图片中分别识别出了杯子,手机,还有人;同时后面还跟着其分析出的相似度。

以上就是一个简单目标检测的过程,而R-CNN是一个在目标检测的基础上的一个算法

2.R-CNN基本工作流程:

1.接收一个图像, 使用Selective Search选择大约2000个从上到下的类无关的候选区域(proposal)
2.将提取出来的候选区域转换为统一大小的图片(拉升/压缩等方法), 使用CNN模型提取每一个候选区域的固定长度的特征.
3.使用特定类别的线性SVM分类器对每一个候选区域进行分类.
4.Bounding Box回归.

3.R-CNN的优点与不足:

R-CNN较之于传统方法的主要优势:
1. 使用了Select Search进行proposal的选择, 极大地减少了proposal的数量.(百万级别~2000左右)
2. 深度学习提取特征来代替人为设计, 较大地提高了精度和效率.
R-CNN的不足:
训练分为了多个步骤. 包括Select Search进行proposal的选择, CNN的模型训练, SVM的分类, Bounding Box回归等, 整个过程需要的时间过长.
 

除此之外

提一下上面文件中出现的YOLO:

 YOLO (CVPR2016, oral)

(You Only Look Once: Unified, Real-Time Object Detection)

 YOLO一类的方法使用了回归的思想,利用整张图作为网络的输入,直接在图像的多个位置上回归出这个位置的目标边框,以及目标所属的类别。

 作为了解便可,以后再继续学习,同时还有目标检测的多方面应用。

 ———————————————————————————————

三.手势识别

识别:是计算机科学和语言技术中的一个主题,目的是通过数学 算法 来识别人类手势。

下面运行一个简单的手势识别代码:

 这是一个简单的二维手势识别,二维手势识别拥有了动态的特征,可以追踪手势的运动。

当然,现在的手势识别从二维识别发展到三维手势识别,从静态发展到动态识别,更甚至可以识别各种手型、手势和动作。常见的有通过传感器和光学摄像头来完成。

而目前主要有3种硬件实现方式,加上先进的计算机视觉软件算法就可以实现三维手势识别了。

 包括:结构光(Structure Light)、光飞时间(Time of Flight)、多角成像(Multi-camera)

                !! 有兴趣的时候可以多去了解看看!!

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Rise9z

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值