【视觉调试】ZH视觉调试SVM笔记

十年一梦实验室

于 2022-10-26 12:41:39 发布

阅读量751

点赞数

分类专栏： opencv 文章标签： opencv 机器视觉

本文链接：https://blog.csdn.net/cxyhjl/article/details/127530282

版权

opencv 专栏收录该内容

87 篇文章 12 订阅

订阅专栏

//识别验证

int MyClassOfTrain::recognize_object() {

cv::Mat src = cv::imread("./TrainData/测试集/1.bmp");

if (src.empty()) {

return -1;

}

time_t t_start = time(0);

char pic_name[64];

strftime(pic_name, sizeof(pic_name), "%Y-%m-%d %H-%M-%S", localtime(&t_start)); //年-月-日时-分-秒

std::string temp_name = pic_name;

std::string picPath = "./TrainData/测试集/" + temp_name + ".jpg";

std::string picPathbmp = "./TrainData/测试集/" + temp_name + ".bmp";

cv::imwrite(picPathbmp, src);

remove("./TrainData/测试集/1.bmp");

//cv::namedWindow("src", cv::WINDOW_FREERATIO);

//cv::imshow("src", src);

//cv::Mat dst1;

//AutoGammaCorrection(src, dst1);

//cv::namedWindow("dst1", cv::WINDOW_FREERATIO);

//cv::imshow("dst1", dst1);

//cv::waitKey(0);

//dst1.copyTo(src);

//cv::namedWindow("2", cv::WINDOW_FREERATIO);

//cv::imshow("2", src);

//cv::waitKey(0);

cv::Ptr<cv::ml::SVM>model = cv::ml::SVM::create();

model = cv::Algorithm::load<cv::ml::SVM>("./TrainData/SVM_HOG.xml");

if (model->empty()) {

return -2;

}

cv::HOGDescriptor Myhog;

cv::Mat svecsmat = model->getSupportVectors();

int DescriptorDim = model->getVarCount();

int svdim = model->getVarCount();

int numofsv = svecsmat.rows;

cv::Mat alphamat = cv::Mat::zeros(numofsv, svdim, CV_32F);

cv::Mat svindex = cv::Mat::zeros(1, numofsv, CV_64F);

float rho = model->getDecisionFunction(0, alphamat, svindex);

cv::Mat Result;

alphamat.convertTo(alphamat, CV_32F);

Result = -1 * alphamat * svecsmat;

std::vector<float> vec;

for (int i = 0; i < svdim; ++i) {

vec.push_back(Result.at<float>(0, i));

}

vec.push_back(rho);//

Myhog.setSVMDetector(vec);

std::vector<cv::Rect> found, found_filtered;//矩形框数组

//Myhog.detectMultiScale(src, found, 0, cv::Size(8, 8), cv::Size(8, 8), 1.051, 30.0);//对图片进行多尺度检测 src, found, 0, cv::Size(16, 16), cv::Size(32, 32), 2.5, 20

Myhog.detectMultiScale(src, found, 0, cv::Size(16, 16), cv::Size(16, 16), 1.051, 3);//4相对3检测不到且变慢。变大3减少误分类。 5最终红色木块参数

//Myhog.detectMultiScale(src, found, 0, cv::Size(32, 32), cv::Size(32, 32), 1.05, 30);

if (found.size() == 0) {

//Myhog.detectMultiScale(src, found, 0, cv::Size(8, 8), cv::Size(8, 8), 1.05, 2);//检测不到木块cv::Size(8, 8)太小

Myhog.detectMultiScale(src, found, 0, cv::Size(8, 8), cv::Size(8, 8), 1.05, 2);//对图片进行多尺度检测 src, found, 0, cv::Size(8, 8), cv::Size(8, 8), 1.05, 2

}

//找出所有没有嵌套的矩形框r,并放入found_filtered中,如果有嵌套的话,则取外面最大的那个矩形框放入found_filtered中

for (int i = 0; i < found.size(); i++) {

if (0 > found[i].width || found[i].width > 4000)

continue;

cv::Rect r = found[i];

int j = 0;

for (; j < found.size(); j++)

if (j != i && (r & found[j]) == r)

break;

if (j == found.size())

found_filtered.push_back(r);

}

for (int i = 0; i < found_filtered.size(); i++) {

cv::Rect r = found_filtered[i];

rectangle(src, r.tl(), r.br(), cv::Scalar(255), 7);

}

//cv::imwrite("./TrainData/测试集/1.jpg", src);

cv::namedWindow("oriImg", cv::WINDOW_FREERATIO);

cv::imwrite(picPath, src);

cv::imshow("oriImg", src);

cv::waitKey(0);

cv::destroyAllWindows();

return 1;

}

构造函数：

cv::HOGDescriptor hog(cv::Size(576, 576), cv::Size(192, 192), cv::Size(96, 96), cv::Size(96, 96), 9);//HOG检测器，用来计算HOG描述子的，依次为检测窗口,块尺寸,块步长,cell尺寸,直方图个数

/**@brief Creates the HOG descriptor and detector with default params.

aqual to HOGDescriptor(Size(64,128), Size(16,16), Size(8,8), Size(8,8), 9 )

CV_WRAP HOGDescriptor() : winSize(192,192), blockSize(64,64), blockStride(32,32),

cellSize(32,32), nbins(9), derivAperture(1), winSigma(-1),

histogramNormType(HOGDescriptor::L2Hys), L2HysThreshold(0.2), gammaCorrection(true),

free_coef(-1.f), nlevels(HOGDescriptor::DEFAULT_NLEVELS), signedGradient(false)

{}

/** @overload

@param _winSize sets winSize with given value.

@param _blockSize sets blockSize with given value.

@param _blockStride sets blockStride with given value.

@param _cellSize sets cellSize with given value.

@param _nbins sets nbins with given value.

@param _derivAperture sets derivAperture with given value.

@param _winSigma sets winSigma with given value.

@param _histogramNormType sets histogramNormType with given value.

@param _L2HysThreshold sets L2HysThreshold with given value.

@param _gammaCorrection sets gammaCorrection with given value.

@param _nlevels sets nlevels with given value.

@param _signedGradient sets signedGradient with given value.

CV_WRAP HOGDescriptor(Size _winSize, Size _blockSize, Size _blockStride,

Size _cellSize, int _nbins, int _derivAperture=1, double _winSigma=-1,

HOGDescriptor::HistogramNormType _histogramNormType=HOGDescriptor::L2Hys,

double _L2HysThreshold=0.2, bool _gammaCorrection=false,

int _nlevels=HOGDescriptor::DEFAULT_NLEVELS, bool _signedGradient=false)

: winSize(_winSize), blockSize(_blockSize), blockStride(_blockStride), cellSize(_cellSize),

nbins(_nbins), derivAperture(_derivAperture), winSigma(_winSigma),

histogramNormType(_histogramNormType), L2HysThreshold(_L2HysThreshold),

gammaCorrection(_gammaCorrection), free_coef(-1.f), nlevels(_nlevels), signedGradient(_signedGradient)

{}

opencv——HOG详解_haoxiaodao的博客-CSDN博客

HOGDescriptor::SetSVMDetector()有些限制

1. linear kernel only

2. imgsize == winsize

/** @brief Detects objects of different sizes in the input image. The detected objects are returned as a list

of rectangles.

@param img Matrix of the type CV_8U or CV_8UC3 containing an image where objects are detected.

@param foundLocations Vector of rectangles where each rectangle contains the detected object.

@param hitThreshold Threshold for the distance between features and SVM classifying plane.

Usually it is 0 and should be specified in the detector coefficients (as the last free coefficient).

But if the free coefficient is omitted (which is allowed), you can specify it manually here.

@param winStride Window stride. It must be a multiple of block stride.

@param padding Padding

@param scale Coefficient of the detection window increase.

@param finalThreshold Final threshold

@param useMeanshiftGrouping indicates grouping algorithm

virtual void detectMultiScale(InputArray img, CV_OUT std::vector<Rect>& foundLocations,

double hitThreshold = 0, Size winStride = Size(),

Size padding = Size(), double scale = 1.05,

double finalThreshold = 2.0, bool useMeanshiftGrouping = false) const;

/** @brief 检测输入图像中不同大小的对象。检测到的对象作为矩形列表返回。

@param img CV_8U 或 CV_8UC3 类型的矩阵，包含检测到对象的图像。

@param foundLocations 矩形向量，其中每个矩形都包含检测到的对象。

@param hitThreshold 特征和 SVM 分类平面之间距离的阈值。通常为 0，应在检测器系数中指定（作为最后一个自由系数）。但如果自由系数被省略（这是允许的），您可以在此处手动指定。

@param winStride 窗口步幅。它必须是块步长的倍数。

@param padding 填充

@param scale 检测窗口增加的系数。

@param finalThreshold 最终阈值

@param useMeanshiftGrouping 表示分组算法

常见的pad size 有(8, 8), (16, 16), (24, 24), (32, 32).

HOG detectMultiScale 参数分析 - klitech - 博客园 (cnblogs.com)

/**@example samples/cpp/train_HOG.cpp

/** @brief Computes HOG descriptors of given image.

@param img Matrix of the type CV_8U containing an image where HOG features will be calculated.

@param descriptors Matrix of the type CV_32F

@param winStride Window stride. It must be a multiple of block stride.

@param padding Padding

@param locations Vector of Point

CV_WRAP virtual void compute(InputArray img,

CV_OUT std::vector<float>& descriptors,

Size winStride = Size(), Size padding = Size(),

const std::vector<Point>& locations = std::vector<Point>()) const;

/**@example samples/cpp/train_HOG.cpp

/** @brief 计算给定图像的 HOG（方向直方图梯度）描述符。

@param img CV_8U 类型的矩阵，包含将计算 HOG 特征的图像。

@param descriptors CV_32F 类型的矩阵

@param winStride 窗口步幅。它必须是块步长的倍数。

@param padding 填充

@param locations 点向量

hog.compute(src, descriptors, cv::Size(16, 16));//计算HOG描述子，检测窗口移动步长(16,16)

//构造

cv::HOGDescriptor hog(cv::Size(576, 576), cv::Size(192, 192), cv::Size(96, 96), cv::Size(96, 96), 9); //HOG检测器，用来计算HOG描述子的，依次为检测窗口,块尺寸,块步长,cell尺寸,直方图个数

//计算

hog.compute(src, descriptors, cv::Size(16, 16));//计算HOG描述子，检测窗口移动步长(16,16)

//预测

Myhog.detectMultiScale(src, found, 0, cv::Size(16, 16), cv::Size(32, 32), 2.5, 20);//对图片进行多尺度检测 src, found, 0, cv::Size(16, 16), cv::Size(32, 32), 2.5, 20

HOG detectMultiScale 参数分析 - klitech - 博客园 (cnblogs.com)

SVM的类型（5种）

1、CvSVM::C_SVC : C类支撑向量分类机。 n类分组（n≥2），容许用异常值处罚因子C进行不完全分类。

2、CvSVM::NU_SVC : 类支撑向量分类机。n类似然不完全分类的分类器。参数为庖代C（其值在区间【0，1】中，nu越大，决定计划鸿沟越腻滑）。

3、CvSVM::ONE_CLASS : 单分类器，所有的练习数据提取自同一个类里，然后SVM建树了一个分界线以分别该类在特点空间中所占区域和其它类在特点空间中所占区域。

4、CvSVM::EPS_SVR : 类支撑向量回归机。练习集中的特点向量和拟合出来的超平面的间隔须要小于p。异常值处罚因子C被采取。

5、CvSVM::NU_SVR : 类支撑向量回归机。庖代了 p。

Opencv中的核函数定义：

CvSVM::LINEAR : 线性内核，没有任何向映射至高维空间，线性区分（或回归）在原始特点空间中被完成，这是最快的选择。

CvSVM::POLY : 多项式内核：

CvSVM::RBF : 基于径向的函数，对于大多半景象都是一个较好的选择：

CvSVM::SIGMOID : Sigmoid函数内核：