介绍
随着人工智能,机器学习和自动化的出现,计算机视觉变得更加重要。在我们的团队中,我们建立了使用计算机视觉的专业知识,作为参与AI和机器学习的新项目的一部分。
我们想分享我们的经验,特别是在使用OpenCV进行物体检测方面。
我们的目标是计算使用计算机视觉与OpenCV库在屏幕上交叉抽象线的人数。
在本文中,我们将介绍使用OpenCV执行对象识别的两种方法,并将它们相互比较。这两种方法各有利弊,我们希望这种比较能帮助您选择最适合您的任务。
机器学习算法的目标识别
用于对视频流中的人进行计数的第一种方法是借助于机器学习算法来区分每个单独的对象。为此,HOGDescriptor
该类已在OpenCV中实现。
HOG(Oriented Gradients直方图)是用于计算机视觉和图像处理以检测对象的特征描述符。该技术基于计算图像的局部部分中的梯度方向的出现。
HOGDescriptor
实现具有定向梯度的直方图对象的检测器。当在对象识别中使用HOG时,基于监督学习(支持向量机)对描述符进行分类。
支持向量机(SVM)是一种监督学习模型,包括一组相关的学习算法。这些算法用于分类目的。基于支持向量计算的系数用作分类的基础。应该根据训练数据(XML文件)计算一组系数。此文件包含有关模型/分类器的完整信息。
OpenCV包括两组用于人员检测的预设节点:Daimler People Detector和Default People Detector。
这是一个如何HOGDescriptor
使用的例子(功能界面可以在官方的OpenCV网站上找到):
cv::HOGDescriptor hog;
hog.setSVMDetector(cv::HOGDescriptor::getDefaultPeopleDetector());
// for every frame
std::vector<cv::Rect> detected;
hog.detectMultiScale(frame, detected, 0, cv::Size(8, 8), cv::Size(32, 32), 1.05f, 2);