opencv实时识别指定物体

opencv 实时识别指定物体

一. 引入

    opencv人脸识别大家应该都听说过,本篇目的是利用opencv从视频帧中识别指定的物体,并框出来,且可以保存截取到的物体图片,会将整个流程都讲一下,包括训练自己的分类器,使用训练好的分类器进行识别。这里以识别舌头为例。


二.  环境:

    1.  python 3.6.3
    2. opencv 3.4.0

三. 训练自己的分类器


1. 注意点:训练集分为正样本,负样本,样本全部为灰度图片,正样本图片尺寸需要固定,一般40*40左右即可,大了电脑跑不动,负样本尺寸不固定,负样本数量要比正样本多才行,少了有问题。
图片批量缩小工具下载:链接:https://pan.baidu.com/s/1pMAp19p 密码:vpp1
图片批量灰度处理:使用美图秀秀

2. 正样本制作,使用美图秀秀将舌头的图片全部裁剪出来(尺寸一致为:40*40的),保存到一个文件夹pos中,当然可以先用大尺寸正方形框进行裁剪,然后再用图片缩小工具进行制定尺寸缩小。最后再用美图秀秀批量灰度化。
附上名字自动有序化Java代码:
String path = "C:\\Users\\Administrator\\Desktop\\pos\\";
		File f = new File(path);
		File[] files = f.listFiles();
		for (File file : files) {
			i++;
			file.renameTo(new File(path+i+"."+file.getName().split("\\.")[1]));
		}
处理后得到如下所示图片:

3. 负样本制作:如上操作类似,不过这里不要求尺寸一样,但是负样本图片中一定不要包含待识别的区域(如这里的:舌头)
如下所示:



4. 生成样本资源记录文件:

a. 正样本 资源记录文件

新建pos文件夹,将正样本的灰度图拷贝进去
使用JAVA代码生成正样本资源记录文件:
String path = "E:\\tools\\python\\eclipse\\work\\pythonTest\\demo\\0202\\img\\train\\tongue\\pos\\";
		File txtfile = new File(path+"pos.txt");
		FileOutputStream fos = new FileOutputStream(txtfile);
		PrintWriter pw = new PrintWriter(fos,true);
		String s = "";
		File[] files = new File(path).listFiles();
		for (File file : files) {
			pw.println("pos/"+file.getName()+" 1 0 0 40 40");
		}
生成后删除最后一行的带有(pos.txt)的内容,让正样本资源记录文件内容如下类似所示:


(1 0 0 40 40)分别指代: 数量  左上方的坐标位置(x,y)  右下方的坐标位置(x,y)
处理好后,将pos.txt 移动到上一级文件夹


b. 负样本资源记录文件

新建neg文件夹,将负样本的灰度图拷贝进去
使用JAVA代码生成负样本资源记录文件:
String path = "E:\\tools\\python\\eclipse\\work\\pythonTest\\demo\\0202\\img\\train\\tongue\\neg\\";
		File txtfile = new File(path+"neg.txt");
		FileOutputStream fos = new FileOutputStream(txtfile);
		PrintWriter pw = new PrintWriter(fos,true);
		String s = "";
		File[] files = new File(path).listFiles();
		for (File file : files) {
			pw.println("neg/"+file.getName());
			
		}
生成后删除最后一行的带有(neg.txt)的内容,让负样本资源记录文件内容如下类似所示:


处理好后,将negtxt 移动到上一级文件夹

得到如图所示文件夹结构:



5. 使用opencv提供的opencv_createsamples.exe程序生成样本vec文件,新建批处理文件:createsamples.bat
内容如下:

opencv_createsamples.exe -vec pos.vec -info pos.txt -num 25 -w 40 -h 40
pause
说明:25是正样本图片的数量   40 40 是正样本图片的宽高

这些参数的详细解释:http://www.opencv.org.cn/opencvdoc/2.3.2/html/doc/user_guide/ug_traincascade.html

运行后会生成 pos.vec文件


6. 使用opencv提供的opencv_traincascade.exe程序训练分类器,新建xml文件夹,再新建批处理文件:LBP_train.bat
内容如下:

opencv_traincascade.exe -data xml -vec pos.vec -bg neg.txt -numPos 25 -numNeg 666 -numStages 10 -w 40 -h 40 -minHitRate 0.999 -maxFalseAlarmRate 0.2 -weightTrimRate 0.95 -featureType LBP
pause
说明: 25是正样本图片的数量   666是负样本图片的数量   numNeg是层级数  40 40是训练样本的宽高 .....
具体参数解释请查看文档:http://www.opencv.org.cn/opencvdoc/2.3.2/html/doc/user_guide/ug_traincascade.html

运行后会在xml文件夹生成如下文件:


其中cascade.xml是我们需要使用的分类器


四 . 测试训练好的分类器


'''
Created on 2018年2月2日
实时人脸检测
@author: nuohy
'''
import cv2

# 加载opencv自带的人脸分类器
# faceCascade = cv2.CascadeClassifier("haarcascade_frontalface_alt2.xml")
# faceCascade.load('E:/python/opencv/opencv/sources/data/haarcascades/haarcascade_frontalface_alt2.xml')

faceCascade = cv2.CascadeClassifier("cascade.xml")
faceCascade.load('E:/tools/python/eclipse/work/pythonTest/demo/0202/img/train/tongue/xml/cascade.xml')

cap = cv2.VideoCapture(0)
flag = 0
timeF = 10
while True:
    flag+=1
    ret, frame = cap.read()
    img = frame.copy()
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
    rect = faceCascade.detectMultiScale(
        gray,
        scaleFactor=1.15,
        minNeighbors=3,
        minSize=(3,3),
        flags = cv2.IMREAD_GRAYSCALE
    )
    for (x, y, w, h) in rect:
        cv2.rectangle(frame, (x, y), (x+w, y+h), (0, 255, 0), 2)
        #识别到物体后进行裁剪保存
        #jiequ = img[x:(x+w), y:(y+h)]
        #cv2.imwrite('E://tools//python//eclipse//work//pythonTest//demo//0202//img//save//'+str(flag) + '.jpg',jiequ) #save as jpg

    #读取到保存图片
#     if(flag%timeF==0):
#         cv2.imwrite('E://tools//python//eclipse//work//pythonTest//demo//0202//img//save//'+str(flag) + '.jpg',frame) #save as jpg


    cv2.imshow('frame', frame)
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break
cap.release()
cv2.destroyAllWindows()

 效果图如下所示:




所有需要用到的文件下载地址:  http://download.csdn.net/download/qq_27063119/10238488  
(需要5积分,没有的至我邮箱 nuohy@qq.com)




  • 69
    点赞
  • 530
    收藏
    觉得还不错? 一键收藏
  • 40
    评论
### 回答1: OpenCV是一种流行的计算机视觉库,可以用来识别和跟踪指定物体。在使用OpenCV进行物体识别时,需要进行一系列预处理工作,包括图像的读取、转换和过滤。接着,使用OpenCV中提供的特征检测算法,如SIFT、SURF、ORB等算法,提取待检测物体的特征描述符。将提取的物体特征与参考图像中相应物体的特征描述符进行匹配,从而识别待检测物体OpenCV还提供了深度学习模型,如YOLO、SSD等,可以用来检测和识别在图像中出现的物体。这些模型基于深度神经网络,在大规模图像数据集上进行训练,可以自动地学习和提取物体的特征,从而在图像中进行准确的物体识别和检测。 总体而言,OpenCV是一种功能强大的计算机视觉库,可以用来识别和跟踪指定物体。根据待检测物体的特征不同,可以选择适合的特征检测算法或深度学习模型进行物体识别。但是,OpenCV使用时需要注意参数的调整和算法的选择,以及对性能的考虑。 ### 回答2: OpenCV是一个广泛应用于计算机视觉和机器学习等领域的开源计算机视觉库,其提供了一些函数和工具来检测、识别和分类不同的对象。在OpenCV中实现物体识别的方法主要分为两类:基于特征匹配的方法和基于深度学习的方法。下面简单介绍这两种方法。 1. 基于特征匹配的方法 该方法的基本思想是在目标物体和图像中提取特征点,计算它们的描述符,并利用特征点匹配算法找到物体在图像中的位置。常见的特征点描述符方法有SIFT、SURF和ORB等。主要步骤包括: (1)在目标物体中提取一些特征点和描述符。 (2)在检测图像中提取相同数量的特征点和描述符。 (3)通过对比两组描述符,找到最佳的匹配点。 (4)使用匹配点来计算物体在图像中地位置并进行标记。 该方法具有一定的普适性,能够在不同的场景中实现物体识别。但是,它对环境变化、物体旋转、缩放等因素比较敏感。 2. 基于深度学习的方法 该方法是近年来发展最快的物体识别技术,具有很强的抗噪、容错性和识别准确度。该方法的基本思想是通过深度学习算法从大量样本数据中学习到物体的特征表达,然后采用卷积神经网络(CNN)等算法对目标物体在图像中的位置进行定位和分类。常见的深度学习框架包括TensorFlow、PyTorch等。主要步骤包括: (1)准备足够的样本数据集进行训练。 (2)设计合适的卷积神经网络结构。 (3)使用训练数据集对网络进行训练,调整网络参数。 (4)对检测图像进行测试,根据网络输出的结果确定物体位置和类别。 总之,基于特征匹配和基于深度学习的方法都能够实现物体识别。在实际应用中,需要根据具体的场景和需求选择合适的方法,并进行不断的优化和调整。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 40
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值