这段代码是一个简单的行人检测程序,使用OpenCV库来实现。初学者可以尝试学习进行行人检测,行人检测主要用来判断输入图片(或视频)内是否包含行人,若检测到行人,则给出其具体的位置信息。该位置信息是智能视频监控、人体行为分析、智能驾驶、智能机器人等应用的关键基础。由于行人可能处于移动状态,也可能处于静止状态,且外观容易受到体型、姿态、衣着、拍摄角度、遮挡等多种因素的影响,因此行人检测在计算机视觉领域内成为研究热点与难点。
导入库
import cv2 as cv
import numpy as np
创建了一个HOG特征描述符对象。HOG是一种在计算机视觉和图像处理中用于对象检测的特征描述符。
hog = cv.HOGDescriptor()
设置HOG特征描述符的SVM检测器。SVM是一种支持向量机,主要用于分类问题。cv.HOGDescriptor_getDefaultPeopleDetector()
返回一个默认的人体检测器。
hog.setSVMDetector(cv.HOGDescriptor_getDefaultPeopleDetector())
创建一个VideoCapture对象,用于从摄像头读取视频。这里的参数0表示使用默认的摄像头。
cap = cv.VideoCapture(0)
这是一个无限循环,用于不断地从摄像头读取视频帧,使用VideoCapture对象的read()
方法从摄像头读取一帧。ret
是一个布尔值,指示是否成功读取帧。frame
是读取的帧。
while True:
ret,frame = cap.read()
使用HOG特征描述符的detectMultiScale()
方法检测帧中的人体。winStride=(4,4)
指定了检测窗口的步长,padding=(10,10)
指定了每个检测窗口周围的填充大小。
boxes,weights = hog.detectMultiScale(frame,winStride=(4,4),padding=(10,10))
使用cv.rectangle()
函数在图像帧上绘制一个矩形框,该矩形框左上角坐标为(x, y),宽度为w,高度为h,颜色为绿色(BGR:(0,255,0)),线宽为2。
for (x,y,w,h) in boxes:
cv.rectangle(frame,(x,y),(x+w,y+h),(0,255,0),2)
计算矩形框的中心点坐标(center_x, center_y)。这里,(x+x+w) / 2
和(y+y+h) / 2
分别是计算中心点的x坐标和y坐标的公式。
center_x = (x+x+w) / 2
center_y = (y+y+h) / 2
用cv.circle()
函数在图像帧上绘制一个圆形标记,该圆形标记的圆心坐标为(center_x, center_y),半径为5,颜色为红色(BGR:(0,0,255)),线宽为-1(实心)。这样,在图像帧上就标注出了对象的中心点。
cv.circle(frame,(int(center_x),int(center_y)),5,(0,0,255),-1)
显示窗口,注意等待键盘输入。参数1表示等待1毫秒。如果在这段时间内用户按下了键盘上的任意键,程序将读取该键并返回其ASCII码。这里主要是为了使窗口显示更加流畅,因为每一帧都等待键盘输入
cv.imshow('demo',frame)
cv.waitKey(1)
运行结果
从运行结果可以看出,当前识别效果还不错。但是,在面对复杂情况时,该程序的识别效果将差很多,还需要进一步的优化。后面我会发优化的后的代码。
下面我将完整代码放在这
import cv2 as cv
import numpy as np
hog = cv.HOGDescriptor()
hog.setSVMDetector(cv.HOGDescriptor_getDefaultPeopleDetector())
cap = cv.VideoCapture(r"C:\Users\RANDALL\Desktop\people.mp4")
while True:
ret,frame = cap.read()
boxes,weights = hog.detectMultiScale(frame,winStride=(4,4),padding=(10,10))
for (x,y,w,h) in boxes:
cv.rectangle(frame,(x,y),(x+w,y+h),(0,255,0),2)
center_x = (x+x+w) / 2
center_y = (y+y+h) / 2
cv.circle(frame,(int(center_x),int(center_y)),5,(0,0,255),-1)
cv.imshow('demo',frame)
cv.waitKey(1)