实战工具:Pycharm+python3.7+opencv4.6
算法知识:HOG特征提取、SVM模型构建
实战目的:本次实战的目的是熟悉HOG+SVM工作流算法,初步掌握图像分类的传统算法。
实战记录:本以为在学习原理、算法应用、动手实操后会很顺利的实现行人检测项目,但实战过程却差强人意,所以结果嘛就马马虎虎了。实战过程中所爆露出的不足有以下几点:
- 对opencv、numpy、python的基础知识掌握的不够全面、牢固;
- 对HOG算法的输出数据形式理解不深刻;
- 对SVM模型的相关参数、函数方法一知半解,特别是数据在svm中的作用、输出更是理解的浅显;网上的有关svm的知识过于零散,导致查相关资料的时候很痛苦。
实战不足:没有收集负样本。
实战评价:虽然坎坎坷坷,但还过得去。
1. 准备工作
本次实战使用的数据是MIT行人数据库(有现成的资料,懒得找啦),该数据库为较早公开的行人数据库,共924张行人图片(ppm格式,宽高为64x128),肩到脚的距离约80象素。该数据库只含正面和背面两个视角,无负样本,未区分训练集和测试集。Dalal等采用“HOG+SVM”,在该数据库上的检测准确率接近100%。该数据库的下载链接见这里。
2. 实战代码
"""
加载并整理数据集-->图像的预处理-->图像的特征提取
-->设计分类器-->输出分类器准确率-->测试图像
"""
import cv2
import random
import glob
import numpy as np
# 加载本地图像数据集,并将数据集全部添加到列表中,然后打乱数据顺序
def load_image(filename):
paths = glob.glob(filename)
persons, labels = [], []
for i in paths:
persons.append(cv2.imread(i))