基于支持向量机的行人检测系统设计

最新推荐文章于 2024-03-02 12:11:20 发布

小小蜗牛，大大梦想

最新推荐文章于 2024-03-02 12:11:20 发布

阅读量1.1k

点赞数 1

文章标签：支持向量机机器学习人工智能

本文链接：https://blog.csdn.net/a1233219/article/details/125647343

版权

1．1 题目的主要研究内容

（1）工作的主要描述

利用支持向量机算法，检测自然场景下的行人，并用方框圈出。具体工作步骤可分为：

建立包含行人的一个图像数据集，作为正数据样本；
建立不包含行人的一个图像数据集，作为负数据样本；
在数据集上训练一个SVM;
将SVM应用于每个可能的测试图像块，以确定整个图像是否包含一个行人，如果有行人，将行人用方框圈出。

（2）系统流程图

图1 系统流程图

1．2 题目研究的工作基础或实验条件

（1）硬件环境

一台笔记本

（2）软件环境

Anaconda+python3.9(opencv2、matplotlib、numpy等)

1．3 数据集描述

（1）正样本数据集

正样本数据集，即包含行人的图像数据集，我们使用MIT People数据集，该数据集可以免费用于非商业用途。该数据集一共提供了924张包含行人的彩色图像，每张图像都缩放为64×128像素并对齐，这样人的身体就处在图像的中心位置了。这些图像是在波士顿和剑桥处在不同季节时以及各种光照情况下拍摄的，图片在颜色、纹理、视角（正面或者背面）以及背景等各不相同。

图2 正样本100-104幅图像

（2）负样本数据集

负样本数据集，即不包含行人的图像数据集，我们使用麻省理工学院的计算视觉认知实验室的城市和自然场景数据集。该数据集收集了大量来自于开阔的乡村、内陆城市、山区，以及森林等类别的图像，所有的图像都是彩色的jpeg格式，大小为256×256像素。为了把他们用作与我们之前的行人图像相匹配的一个负样本，我们需要确保所有图像都有相同的像素，所以我们应该把该数据集中的所有图像剪切为大小64×128的感兴趣区域。

1．4 特征提取过程描述

方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种图像特征描述符，HOG已经成功地应用于各种计算机视觉任务，对人进行分类特别合适。HOG特征的基本思想是，边缘方向的分布可以描述图像中物体的局部形状和外观。把图像拆分成小的连通区域，在这些区域内编译梯度方向（或者边缘方向）直方图。然后，描述符是通过连接不同的直方图组合而成的。为了提升性能，局部直方图还可以进行对比度归一化处理，从而对光照和阴影的变化具有更好的不变形。

构建HOG模型的第一步就是计算图像的梯度。把图像分割成小的单元格（例如8像素×8像素），并针对每个单元格计算方向梯度直方图。方向的值会被分割成多个箱子。通常只考虑梯度的方向，不考虑正负（称作无符号梯度）。这里的方向值范围是0度～180度。采用9个箱子的直方图，方向值的分割间距为20度。每个单元格的梯度向量产生一个箱子，该箱子的权重对应梯度的幅值。然后把这些单元格组合成多个区块，每个区块包含固定数量的单元格。图像上的区块可以互相重叠（即可以共用一些单元格）。例如由2×2的单元格组成的一个区块，每个单元格都可以定义一个区块；也就是说，区块的步长为一个单元格，每个单元格属于两个区块。如果区块的步长是两个单元格，那么区块之间就不会重叠。每个区块包含特定数量的单元格直方图。这些直方图串联起来就构成了一个很长的向量。为了使模型具有可比性，要对向量做归一化处理。最后将所有区块的向量串联起来，组成一个非常大的向量（假设图像为64×64，每个单元格为8×8，每个区块为16×16，步长为1个单元格，共得到7个区块；最终得到向量的维度是49×36=1764），这个大向量就是图像的HOG模型。由此可见，图像HOG模型的向量的维度非常高。这个向量就代表了图像的特征，可用于各种物体图像的分类。