Opencv C++教学视频源代码整理（2）

最新推荐文章于 2023-03-28 11:17:25 发布

Qiuyu2550317721

最新推荐文章于 2023-03-28 11:17:25 发布

阅读量474

点赞数 1

文章标签： c++

本文链接：https://blog.csdn.net/qq_50081337/article/details/120034103

版权

P132 CNN模型预测年龄与性别

(1)、CSDN上的CNN模型预测年龄与性别代码1：成功，效果一般

#include <opencv2/opencv.hpp>
#include <opencv2/dnn.hpp>
#include <iostream>

using namespace cv;
using namespace cv::dnn;
using namespace std;
//人脸检测文件
String haar_file = "D:/OpenCV神经网络2/CNN级联分类器检测人脸预测年龄性别/haarcascade_frontalface_alt_tree.xml";
//年龄预测模型
String age_model = "D:/OpenCV神经网络2/CNN级联分类器检测人脸预测年龄性别/age_net.caffemodel";
//年龄描述文件
String age_text = "D:/OpenCV神经网络2/CNN级联分类器检测人脸预测年龄性别/deploy_age.prototxt";

//性别预测模型
String gender_model = "D:/OpenCV神经网络2/CNN级联分类器检测人脸预测年龄性别/gender_net.caffemodel";
//年龄描述文件
String gender_text = "D:/OpenCV神经网络2/CNN级联分类器检测人脸预测年龄性别/deploy_gender.prototxt";

void predict_age(Net &net, Mat &image);//预测年龄
void predict_gender(Net &net, Mat &image);//预测性别
int main(int argc, char** argv) {
   Mat src = imread("C:/Users/25503/Desktop/樊玉和.jpg");
   if (src.empty()) {
       printf("could not load image...\n");
       return -1;
   }
   namedWindow("input", CV_WINDOW_AUTOSIZE);
   imshow("input", src);
   CascadeClassifier detector;
   detector.load(haar_file);//人脸检测
   vector<Rect> faces;
   Mat gray;
   cvtColor(src, gray, COLOR_BGR2GRAY);
   detector.detectMultiScale(gray, faces, 1.02, 1, 0, Size(40, 40), Size(200, 200));
   //加载网络
   Net age_net = readNetFromCaffe(age_text, age_model);
   Net gender_net = readNetFromCaffe(gender_text, gender_model);

   for (size_t t = 0; t < faces.size(); t++) {
       rectangle(src, faces[t], Scalar(30, 255, 30), 2, 8, 0);
       //年龄、性别预测
       Mat face = src(faces[t]);//自己加的，不加会报错，提示类型错误
       predict_age(age_net, face);
       predict_gender(age_net, face);
   }
   imshow("age-gender-prediction-demo", src);

waitKey(0);
return 0;
}

vector<String> ageLabels() {
   vector<String> ages;
   ages.push_back("0-2");
   ages.push_back("4 - 6");
   ages.push_back("8 - 13");
   ages.push_back("15 - 20");
   ages.push_back("25 - 32");
   ages.push_back("38 - 43");
   ages.push_back("48 - 53");
   ages.push_back("60-");
   return ages;
}

void predict_age(Net &net, Mat &image) {
   // 输入
   Mat blob = blobFromImage(image, 1.0, Size(227, 227));
   net.setInput(blob, "data");
   // 预测分类
   Mat prob = net.forward("prob");
   Mat probMat = prob.reshape(1, 1);//变为一行
   Point classNum;
   double classProb;

   vector<String> ages = ageLabels();
   minMaxLoc(probMat, NULL, &classProb, NULL, &classNum);//提取最大概率的编号和概率值
   int classidx = classNum.x;
   putText(image, format("age:%s", ages.at(classidx).c_str()), Point(1, 10), FONT_HERSHEY_PLAIN, 0.8, Scalar(0, 0, 255), 1);
}

void predict_gender(Net &net, Mat &image) {
   // 输入
   Mat blob = blobFromImage(image, 1.0, Size(227, 227));
   net.setInput(blob, "data");
   // 预测分类
   Mat prob = net.forward("prob");
   Mat probMat = prob.reshape(1, 1);
   putText(image, format("gender:%s", (probMat.at<float>(0, 0) > probMat.at<float>(0, 1) ? "Man" : "Female")),
       Point(2, 20), FONT_HERSHEY_PLAIN, 0.8, Scalar(0, 0, 255), 1);
}

(2)、教学视频上的 CNN模型预测年龄与性别代码：一般，教学视频代码可能不行，需要OPenCV 3.3版本

#include <opencv2/opencv.hpp>
#include <opencv2/dnn.hpp>
#include <iostream>

using namespace cv;
using namespace cv::dnn;
using namespace std;

String haar_file = "D:/OpenCV神经网络2/CNN级联分类器检测人脸预测年龄性别/haarcascade_frontalface_alt_tree.xml";//人脸检测文件

String age_model = "D:/OpenCV神经网络2/CNN级联分类器检测人脸预测年龄性别/age_net.caffemodel";
String age_text = "D:/OpenCV神经网络2/CNN级联分类器检测人脸预测年龄性别/deploy_age.prototxt";

String gender_model = "D:/OpenCV神经网络2/CNN级联分类器检测人脸预测年龄性别/gender_net.caffemodel";
String gender_text = "D:/OpenCV神经网络2/CNN级联分类器检测人脸预测年龄性别/deploy_gender.prototxt";

void predict_age(Net &net, Mat &image);
void predict_gender(Net &net, Mat &image);
int main(int argc, char** argv) {
   Mat src = imread("C:/Users/25503/Desktop/12321.jpg");
   if (src.empty()) {
       printf("could not load image...\n");
       return -1;
   }
   namedWindow("input", CV_WINDOW_AUTOSIZE);
   imshow("input", src);
   CascadeClassifier detector;
   detector.load(haar_file);
   vector<Rect> faces;
   Mat gray;
   cvtColor(src, gray, COLOR_BGR2GRAY);
   detector.detectMultiScale(gray, faces, 1.02, 1, 0, Size(40, 40), Size(200, 200));

Net age_net = readNetFromCaffe(age_text, age_model);
Net gender_net = readNetFromCaffe(gender_text, gender_model);

   for (size_t t = 0; t < faces.size(); t++) {
       rectangle(src, faces[t], Scalar(0, 0, 255), 2, 8, 0);

       Mat face = src(faces[t]);//自己加的，不加会报错，提示类型错误
       predict_age(age_net, face);
       predict_gender(gender_net, face);
   }
   imshow("age-gender-prediction-demo", src);

waitKey(0);
return 0;
}

   vector<String> ages = ageLabels();
   minMaxLoc(probMat, NULL, &classProb, NULL, &classNum);
   int classidx = classNum.x;
   putText(image, format("age:%s", ages.at(classidx).c_str()), Point(2, 10), FONT_HERSHEY_PLAIN, 0.8, Scalar(0, 0, 255), 1);
}

void predict_gender(Net &net, Mat &image) {
   // 输入
   Mat blob = blobFromImage(image, 1.0, Size(227, 227));
   net.setInput(blob, "data");
   // 预测分类
   Mat prob = net.forward("prob");
   Mat probMat = prob.reshape(1, 1);
   putText(image, format("gender:%s", (probMat.at<float>(0, 0) > probMat.at<float>(0, 1) ? "M" : "F")),
       Point(2, 20), FONT_HERSHEY_PLAIN, 0.8, Scalar(255, 0, 0), 1);
}

P133 GOTURN模型实现视频对象跟踪***失败，但需要时可以调试或者安装opencv 3.3.0版本

String goturn_model = "D:/OpenCV神经网络2/GOTURN算法模型实现视频对象跟踪/goturn.caffemodel";
String goturn_prototxt = "D:/OpenCV神经网络2/GOTURN算法模型实现视频对象跟踪/goturn.prototxt";

(1)、CSDN上的GOTURN模型实现视频对象跟踪代码：（失败）

#include <opencv2/opencv.hpp>
#include <opencv2/dnn.hpp>
#include <iostream>

using namespace cv;
using namespace cv::dnn;
using namespace std;

Net net;

Rect trackObjects(Mat &frame, Mat &prevFrame);
Mat frame, prevFrame;
Rect prevBB;
int main(int argc, char** argv) {
   net = readNetFromCaffe(goturn_prototxt, goturn_model);

   //VideoCapture capture;
   //capture.open("D:/test/dog.avi");

VideoCapture capture(0);

   capture.read(frame);
   frame.copyTo(prevFrame);
   prevBB = selectROI(frame, true, true);
   namedWindow("frame", WINDOW_AUTOSIZE);
   while (capture.read(frame)) {

Rect currentBB = trackObjects(frame, prevFrame);
rectangle(frame, currentBB, Scalar(0, 0, 255), 2, 8, 0);

       // ready for next frame
       frame.copyTo(prevFrame);
       prevBB.x = currentBB.x;
       prevBB.y = currentBB.y;
       prevBB.width = currentBB.width;
       prevBB.height = currentBB.height;

       imshow("frame", frame);
       char c = waitKey(10);
       if (c == 27) {
           break;
       }
   }
}

Rect trackObjects(Mat& frame, Mat &prevFrame) {
   Rect rect;
   int INPUT_SIZE = 227;
   //Using prevFrame & prevBB from model and curFrame GOTURN calculating curBB
   Mat curFrame = frame.clone();
   Rect2d curBB;

   float padTargetPatch = 2.0;
   Rect2f searchPatchRect, targetPatchRect;
   Point2f currCenter, prevCenter;
   Mat prevFramePadded, curFramePadded;
   Mat searchPatch, targetPatch;

prevCenter.x = (float)(prevBB.x + prevBB.width / 2);
prevCenter.y = (float)(prevBB.y + prevBB.height / 2);

   targetPatchRect.width = (float)(prevBB.width*padTargetPatch);
   targetPatchRect.height = (float)(prevBB.height*padTargetPatch);
   targetPatchRect.x = (float)(prevCenter.x - prevBB.width*padTargetPatch / 2.0 + targetPatchRect.width);
   targetPatchRect.y = (float)(prevCenter.y - prevBB.height*padTargetPatch / 2.0 + targetPatchRect.height);

copyMakeBorder(prevFrame, prevFramePadded, (int)targetPatchRect.height, (int)targetPatchRect.height, (int)targetPatchRect.width, (int)targetPatchRect.width, BORDER_REPLICATE);
targetPatch = prevFramePadded(targetPatchRect).clone();

copyMakeBorder(curFrame, curFramePadded, (int)targetPatchRect.height, (int)targetPatchRect.height, (int)targetPatchRect.width, (int)targetPatchRect.width, BORDER_REPLICATE);
searchPatch = curFramePadded(targetPatchRect).clone();

   //Preprocess
   //Resize
   resize(targetPatch, targetPatch, Size(INPUT_SIZE, INPUT_SIZE));
   resize(searchPatch, searchPatch, Size(INPUT_SIZE, INPUT_SIZE));

   //Mean Subtract
   targetPatch = targetPatch - 128;
   searchPatch = searchPatch - 128;

   //Convert to Float type
   targetPatch.convertTo(targetPatch, CV_32F);
   searchPatch.convertTo(searchPatch, CV_32F);

Mat targetBlob = blobFromImage(targetPatch);
Mat searchBlob = blobFromImage(searchPatch);

net.setInput(targetBlob, "data1");
net.setInput(searchBlob, "data2");

   Mat res = net.forward("scale");
   Mat resMat = res.reshape(1, 1);
   //printf("width : %d, height : %d\n", (resMat.at<float>(2) - resMat.at<float>(0)), (resMat.at<float>(3) - resMat.at<float>(1)));

   curBB.x = targetPatchRect.x + (resMat.at<float>(0) * targetPatchRect.width / INPUT_SIZE) - targetPatchRect.width;
   curBB.y = targetPatchRect.y + (resMat.at<float>(1) * targetPatchRect.height / INPUT_SIZE) - targetPatchRect.height;
   curBB.width = (resMat.at<float>(2) - resMat.at<float>(0)) * targetPatchRect.width / INPUT_SIZE;
   curBB.height = (resMat.at<float>(3) - resMat.at<float>(1)) * targetPatchRect.height / INPUT_SIZE;

   //Predicted BB
   Rect boundingBox = curBB;
   return boundingBox;
}

(2)、教学视频上的 GOTURN模型实现视频对象跟踪代码：失败，因为部分语句关键词必须用opencv 3.3.0版本才可以，但学习时用的事3.4.9版本

#include <opencv2/opencv.hpp>
#include <opencv2/dnn.hpp>
#include <iostream>

using namespace cv;
using namespace cv::dnn;
using namespace std;

Net net;
void initGoturn();
Rect trackObjects(Mat& frame, Mat& prevFrame);
Mat frame, prevFrame;
Rect prevBB;
int main(int argc, char** argv) {
   initGoturn();
   //VideoCapture capture;
   //capture.open("01.mp4");
   VideoCapture capture(0);
   capture.read(frame);
   frame.copyTo(prevFrame);
   prevBB = selectROI(frame, true, true);
   namedWindow("frame", CV_WINDOW_AUTOSIZE);
   while (capture.read(frame)) {
       Rect currentBB = trackObjects(frame, prevFrame);
       rectangle(frame, currentBB, Scalar(0, 0, 255), 2, 8, 0);

       // ready for next frame
       frame.copyTo(prevFrame);
       prevBB.x = currentBB.x;
       prevBB.y = currentBB.y;
       prevBB.width = currentBB.width;
       prevBB.height = currentBB.height;

       imshow("frame", frame);
       char c = waitKey(50);
       if (c == 27) {
           break;
       }
   }
}

void initGoturn() {// 只有opencv 3.3.0版本才存在Importer关键词，但学习用的是3.4.9版本，故用到此模块需要重新安装opencv 3.3.0版本
   Ptr<Importer> importer;
   importer = createCaffeImporter(goturn_prototxt, goturn_model);
   importer->populateNet(net);
   importer.release();
}

Rect trackObjects(Mat& frame, Mat& prevFrame) {
   Rect rect;
   int INPUT_SIZE = 227;
   //Using prevFrame & prevBB from model and curFrame GOTURN calculating curBB
   Mat curFrame = frame.clone();
   Rect2d curBB;

   float padTargetPatch = 2.0;
   Rect2f searchPatchRect, targetPatchRect;
   Point2f currCenter, prevCenter;
   Mat prevFramePadded, curFramePadded;
   Mat searchPatch, targetPatch;

prevCenter.x = (float)(prevBB.x + prevBB.width / 2);
prevCenter.y = (float)(prevBB.y + prevBB.height / 2);

   targetPatchRect.width = (float)(prevBB.width * padTargetPatch);
   targetPatchRect.height = (float)(prevBB.height * padTargetPatch);
   targetPatchRect.x = (float)(prevCenter.x - prevBB.width * padTargetPatch / 2.0 + targetPatchRect.width);
   targetPatchRect.y = (float)(prevCenter.y - prevBB.height * padTargetPatch / 2.0 + targetPatchRect.height);

   //Preprocess
   //Resize
   resize(targetPatch, targetPatch, Size(INPUT_SIZE, INPUT_SIZE));
   resize(searchPatch, searchPatch, Size(INPUT_SIZE, INPUT_SIZE));

   //Mean Subtract
   targetPatch = targetPatch - 128;
   searchPatch = searchPatch - 128;

   //Convert to Float type
   targetPatch.convertTo(targetPatch, CV_32F);
   searchPatch.convertTo(searchPatch, CV_32F);

Mat targetBlob = blobFromImage(targetPatch);
Mat searchBlob = blobFromImage(searchPatch);

net.setInput(targetBlob, ".data1");
net.setInput(searchBlob, ".data2");

   Mat res = net.forward("scale");
   Mat resMat = res.reshape(1, 1);
   //printf("width : %d, height : %d\n", (resMat.at<float>(2) - resMat.at<float>(0)), (resMat.at<float>(3) - resMat.at<float>(1)));

   //Predicted BB
   Rect boundingBox = curBB;
   return boundingBox;
}

P134-P136人脸识别理论基础：概述、均值，协方差，协方差矩阵，特征值，特征向量

（1）图像均值与方差、方差与协方差矩阵代码：

#include<opencv2/opencv.hpp>
#include <iostream>

using namespace cv;
using namespace std;

int main(int argc, char** argv)
{
   Mat image = imread("C:/Users/25503/Desktop/999.png");
   if (image.empty())
   {
       printf("could not load image...\n");
       return -1;
   }
   imshow("input image", image);
   Mat means, stddev;//均值和方差
   meanStdDev(image, means, stddev);
   printf("means rows:%d, means cols %d\n", means.rows, means.cols);
   printf("stddev rows:%d,stddev cols %d\n", stddev.rows, stddev.cols);

   for (int row = 0; row < means.rows; row++)
   {
       printf("means %d =%.3f\n", row, means.at<double>(row));
       printf("stddev %d =%.3f\n", row, stddev.at<double>(row));
   }
   Mat samples = (Mat_<double>(5, 3) << 90, 60, 90, 90, 90, 30, 60, 60, 60, 60, 60, 90, 30, 30, 30);
   Mat cov, mu;//协方差和协方差矩阵
   calcCovarMatrix(samples, cov, mu, CV_COVAR_NORMAL | CV_COVAR_ROWS);

   cout << "==============================" << endl;
   cout << "cov:" << endl;
   cout << cov << endl;

cout << "means" << endl;
cout << mu << endl;

waitKey(0);
return 0;
}

(2) 特征值与特征向量矩阵的代码：

#include <opencv2/opencv.hpp>
#include <iostream>

using namespace cv;
using namespace std;

int main(int argc, char** argv)
{
   Mat data = (Mat_<double>(2, 2) <<
       1,2,
       2, 1);
       Mat eigenvalues, eigenvector;//特征值和特征向量矩阵
       eigen(data, eigenvalues, eigenvector);//eigen必须要求的矩阵数据是对阵矩阵
       for (int i = 0; i < eigenvalues.rows; i++)
       {
           printf("eigen value %d :%.3f\n", i, eigenvalues.at<double>(i));
       }

cout << "eigen vector :" << endl;
cout << eigenvector << endl;

waitKey(0);
return 0;

}

P137-P138 PCA原理与应用：PCA是将高维数据降低到低位数据

（1）CSDN上的PCA原理代码：

#include<opencv2/opencv.hpp>
#include<iostream>

using namespace cv;
using namespace std;

double calcPCAorientation(Mat &image, vector<Point>pts);
int main(int argc, char** argv)
{
   Mat src = imread("D:/opencv3.4.9/opencv/sources/samples/data/pca_test1.jpg");
   if (src.empty())
   {
       cout << "图片未找到..." << endl;
       return -1;
   }

   imshow("input image", src);
   Mat gray, binary;
   //转为灰度图
   cvtColor(src, gray, COLOR_BGR2GRAY);
   //转为二值图
   threshold(gray, binary, 0, 255, THRESH_BINARY | THRESH_OTSU);//自动获取阈值
   imshow("binary image", binary);
   vector<vector<Point>>contours;//存储轮廓点信息
   vector<Vec4i>hierachy;
   //轮廓发现
   Mat result = src.clone();
   findContours(binary, contours, hierachy, RETR_TREE, CHAIN_APPROX_SIMPLE, Point());
   for (size_t t = 0; t < contours.size(); t++)
   {
       double area = contourArea(contours[t]);
       if (area > 100000 || area < 100) //如果面积大于100000或小于100，则过滤掉该面积轮廓
           continue;
       drawContours(result, contours, t, Scalar(0, 0, 255), 2, 8);
       double theta = calcPCAorientation(result, contours[t]);
   }

   imshow("contours image", result);
   waitKey(0);
   return 0;
}

double calcPCAorientation(Mat & image, vector<Point> pts)
{
int size = static_cast<int>(pts.size());//获取数据点个数
Mat data_pts = Mat(size, 2, CV_64FC1);//定义一个n行2列的矩阵

   for (int i = 0; i < size; i++)
   {
       data_pts.at<double>(i, 0) = pts[i].x;//矩阵的第一列数据
       data_pts.at<double>(i, 1) = pts[i].y;//矩阵的第二列数据
   }

   //PCA分析处理
   PCA pca_analysis(data_pts, Mat(), PCA::DATA_AS_ROW);
   Point cnt = Point(static_cast<int>(pca_analysis.mean.at<double>(0, 0)),//求均值,第一列一行
       static_cast<int>(pca_analysis.mean.at<double>(0, 1)));//第一列第二行

   circle(image, cnt, 2, Scalar(0, 255, 0), 2, 8, 0);
   vector<Point2d>eigen_vectors(2);//2个特征向量
   vector<double>eigen_vals(2);//2个特征值

   for (int i = 0; i < 2; i++)
   {
       eigen_vals[i] = pca_analysis.eigenvalues.at<double>(i, 0);
       eigen_vectors[i] = Point2d(pca_analysis.eigenvectors.at<double>(i, 0),
           pca_analysis.eigenvectors.at<double>(i, 1));

cout << "第" << i << "个特征值为：" << eigen_vals[i] << endl;

}

   Point p1 = cnt + 0.02*Point(static_cast<int>(eigen_vectors[0].x*eigen_vals[0]), static_cast<int>(eigen_vectors[0].y*eigen_vals[0]));
   Point p2 = cnt - 0.05*Point(static_cast<int>(eigen_vectors[1].x*eigen_vals[1]), static_cast<int>(eigen_vectors[1].y*eigen_vals[1]));
   double angle = atan2(eigen_vectors[0].y, eigen_vectors[0].x); //反三角函数求角度
   cout << "偏转角度=" << angle * (180 / CV_PI) << endl;
   cout << "-------------------------------" << endl;
   cout << "-------------------------------" << endl;
   line(image, cnt, p1, Scalar(255, 0, 0), 2, 8, 0);
   line(image, cnt, p2, Scalar(255, 125, 0), 2, 8, 0);
   /*
   cout << "cnt=" << cnt << endl;
   cout << "p1=" << p1 << endl;
   cout << "p2=" << p2 << endl;
   cout << "-----------------------" << endl;
   */
   return 0;
}

(2) 教学视频上PCA原理与应用代码：

#include <opencv2/opencv.hpp>
#include <iostream>

using namespace cv;
using namespace std;

double calcPCAOrientation(vector<Point> &pts, Mat &image);
int main(int argc, char** argv)
{
   Mat src = imread("D:/opencv3.4.9/opencv/sources/samples/data/pca_test1.jpg");
   if (src.empty())
   {
       printf("could not load image...\n");
       return -1;
   }
   namedWindow("input image", CV_WINDOW_AUTOSIZE);
   imshow("input image", src);

   Mat gray, binary;
   cvtColor(src, gray, COLOR_BGR2GRAY);
   threshold(gray, binary, 0, 255, THRESH_BINARY | THRESH_OTSU);
   imshow("binary image", binary);

   vector<Vec4i> hireachy;
   vector<vector<Point>> contours;
   findContours(binary, contours, hireachy, RETR_LIST, CHAIN_APPROX_NONE);
   Mat result = src.clone();
   for (int i = 0; i < contours.size(); i++)
   {
       double area = contourArea(contours[i]);
       if (area > 1e5 || area < 1e2) continue;
       drawContours(result, contours, i, Scalar(0, 0, 255), 2, 8);
       double theta = calcPCAOrientation(contours[i], result);
   }
   imshow("contours result", result);

   waitKey(0);
   return 0;
}
double calcPCAOrientation(vector<Point> &pts, Mat &image)
{
   int size = static_cast<int>(pts.size());
   Mat data_pts =Mat(size, 2, CV_64FC1);
   for (int i = 0; i < size; i++)
   {
       data_pts.at<double>(i, 0) = pts[i].x;
       data_pts.at<double>(i, 1) = pts[i].y;
   }

   //perfrom PCA projection
   PCA pca_analysis(data_pts, Mat(), CV_PCA_DATA_AS_ROW);
   Point cnt = Point(static_cast<int>(pca_analysis.mean.at<double>(0, 0)),
       static_cast<int> (pca_analysis.mean.at<double>(0, 1)));
   circle(image, cnt, 2, Scalar(0, 255, 0), 2, 8, 0);

   vector<Point2d>vecs(2);
   vector<double> vals(2);
   for (int i = 0; i < 2; i++)
   {
       vals[i] = pca_analysis.eigenvalues.at<double>(i, 0);
       printf("Th %d eigen value :%.2f\n", i, vals[i]);
       vecs[i] = Point2d((pca_analysis.eigenvectors.at<double>(i, 0)),
           pca_analysis.eigenvectors.at<double>(i, 1));

   }
   Point p1 = cnt + 0.02*Point(static_cast<int>(vecs[0].x*vals[0]), static_cast<int>(vecs[0].y*vals[0]));
   Point p2 = cnt - 0.05*Point(static_cast<int>(vecs[1].x*vals[1]), static_cast<int>(vecs[1].y*vals[1]));

line(image, cnt, p1, Scalar(255, 0, 0), 2, 8, 0);
line(image, cnt, p2, Scalar(255, 255, 255), 2, 8, 0);

double angle = atan2(vecs[0].y, vecs[0].x);
printf("angle :%.2f\n", 180 * (angle / CV_PI));

return angle;
}

P139-P140 人脸识别算法之EigenFace（注意，如果EigenFaceRecognizer不可用，则使用的连接器未添加opencv_face349d.lib）

Ptr<BasicFaceRecognizer> model = EigenFaceRecognizer::create();
model->train(images, labels);

（1）CSDN 上的人脸识别算法之EigenFace代码：成功*********

#include <opencv2/opencv.hpp>
#include <opencv2/face.hpp>
#include <iostream>

using namespace cv;
using namespace cv::face;
using namespace std;

int main(int argc, char** argv) {
   string filename = string("D:/OpenCV/orl_faces/image.txt");
   ifstream file(filename.c_str(), ifstream::in);
   if (!file) {
       printf("could not load file correctly...\n");
       return -1;
   }

   if (images.size() < 1 || labels.size() < 1) {
       printf("invalid image path...\n");
       return -1;
   }

   int height = images[0].rows;
   int width = images[0].cols;
   printf("height : %d, width : %d\n", height, width);

   Mat testSample = images[images.size() - 1];
   int testLabel = labels[labels.size() - 1];
   images.pop_back();
   labels.pop_back();

   // train it
   Ptr<BasicFaceRecognizer> model = EigenFaceRecognizer::create();
   model->train(images, labels);

   // recognition face
   int predictedLabel = model->predict(testSample);
   printf("actual label : %d, predict label : %d\n", testLabel, predictedLabel);

   Mat eigenvalues = model->getEigenValues();
   Mat W = model->getEigenVectors();
   Mat mean = model->getMean();
   Mat meanFace = mean.reshape(1, height);
   Mat dst;
   if (meanFace.channels() == 1) {
       normalize(meanFace, dst, 0, 255, NORM_MINMAX, CV_8UC1);
   }
   else if (meanFace.channels() == 3) {
       normalize(meanFace, dst, 0, 255, NORM_MINMAX, CV_8UC3);
   }
   imshow("Mean Face", dst);

   // show eigen faces
   for (int i = 0; i < min(10, W.cols); i++) {
       Mat ev = W.col(i).clone();
       Mat grayscale;
       Mat eigenFace = ev.reshape(1, height);
       if (eigenFace.channels() == 1) {
           normalize(eigenFace, grayscale, 0, 255, NORM_MINMAX, CV_8UC1);
       }
       else if (eigenFace.channels() == 3) {
           normalize(eigenFace, grayscale, 0, 255, NORM_MINMAX, CV_8UC3);
       }
       Mat colorface;
       applyColorMap(grayscale, colorface, COLORMAP_JET);
       char winTitle[128];
       sprintf_s(winTitle, "eigenface_%d", i);
       imshow(winTitle, colorface);
   }

   // 重建人脸
   for (int num = min(10, W.cols); num < min(W.cols, 300); num += 15) {
       Mat evs = Mat(W, Range::all(), Range(0, num));
       Mat projection = LDA::subspaceProject(evs, mean, images[0].reshape(1, 1));
       Mat reconstruction = LDA::subspaceReconstruct(evs, mean, projection);

       Mat result = reconstruction.reshape(1, height);
       if (result.channels() == 1) {
           normalize(result, reconstruction, 0, 255, NORM_MINMAX, CV_8UC1);
       }
       else if (result.channels() == 3) {
           normalize(result, reconstruction, 0, 255, NORM_MINMAX, CV_8UC3);
       }
       char winTitle[128];
       sprintf_s(winTitle, "recon_face_%d", num);
       imshow(winTitle, reconstruction);
   }

waitKey(0);
return 0;
}

(2) 、教学视频上的人脸识别算法之EigenFace代码：演示成功********
准备：将所有图片路径整理到一个文件中代码：（最后没用上，算是一个小知识点积累）
#include <fstream>
using namespace std;

int main()
{
   ofstream file;
   file.open("path.txt");//新建并打开文件
   char str[50] = {};
   for (int i = 1; i <= 40; i++) {
       for (int j = 1; j <= 10; j++) {
           sprintf_s(str, "orl_faces/s%d/%d.pgm;%d", i, j, i);//将数字转换成字符
           file << str << endl;//写入
       }
   }
   return 0;
}

总代码如下：
#include <opencv2/opencv.hpp>
#include <opencv2/face.hpp>
#include <iostream>
#include "opencv2/core/core.hpp"
#include "opencv2/highgui/highgui.hpp"

using namespace cv;
using namespace cv::face;
using namespace std;

int main(int argc, char** agrv)
{
   string filename = string("D:/OpenCV/orl_faces/image.txt");
   ifstream file(filename.c_str(), ifstream::in);
   if (!file)
   {
       printf("could not load file correctly...\n");
       return -1;
   }

   string line, path, classlabel;
   vector<Mat> images;
   vector<int> labels;
   char separator = ';';
   while (getline(file, line))
   {
       stringstream liness(line);
       getline(liness, path, separator);
       getline(liness, classlabel);
       if (!path.empty() && !classlabel.empty())
       {
           //printf("path:%s\n", path.c_str());
           images.push_back(imread(path, 0));
           labels.push_back(atoi(classlabel.c_str()));
       }
   }
   if (images.size() < 1 || labels.size() < 1)
   {
       printf("invalid image path...\n");
       return -1;
   }
   int height = images[0].rows;
   int width = images[0].cols;
   printf("height:%d,width :%d\n", height, width);

   Mat testSample = images[images.size() - 1];//假设将最后一个照片作为要识别的对象
   int testLabel = labels[labels.size() - 1];
   images.pop_back();
   labels.pop_back();

   //train it
   Ptr<BasicFaceRecognizer> model = EigenFaceRecognizer::create();
   model->train(images, labels);

   //recognition face
   int predictedLabel = model->predict(testSample);
   printf("catual label :%d, predict label :%d\n", testLabel, predictedLabel);

   Mat eigenvalues = model->getEigenValues();//特征值
   Mat W = model->getEigenVectors();//特征向量矩阵
   Mat mean = model->getMean();//平均脸
   Mat meanFace = mean.reshape(1, height);
   Mat dst;
   if (meanFace.channels() == 1)
   {
       normalize(meanFace, dst, 0, 255, NORM_MINMAX, CV_8SC1);
   }
   else if (meanFace.channels() == 3)
   {
       normalize(meanFace, dst, 0, 255, NORM_MINMAX, CV_8SC3);
   }
   imshow("Mean Face", dst);

   for (int i = 0; i < min(10, W.cols); i++)
   {
       Mat ev = W.col(i).clone();
       Mat grayscale;
       Mat eigenFace = ev.reshape(1, height);
       if (eigenFace.channels() == 1)
       {
           normalize(eigenFace, grayscale, 0, 255, NORM_MINMAX, CV_8UC1);
       }
       else if (eigenFace.channels() == 3)
       {
           normalize(eigenFace, grayscale, 0, 255, NORM_MINMAX, CV_8UC3);
       }
       Mat colorface;
       applyColorMap(grayscale, colorface, COLORMAP_BONE);
       char winTitle[128];
       sprintf_s(winTitle, "eigenface_%d", i);
       imshow(winTitle, colorface);
   }

   //重建人脸
   for (int num = min(10, W.cols); num < min(W.cols, 300); num += 15)
   {
       Mat evs = Mat(W, Range::all(), Range(0,num));
       Mat projection = LDA::subspaceProject(evs, mean, images[0].reshape(1, 1));
       Mat reconstruction = LDA::subspaceReconstruct(evs, mean, projection);

       Mat result = reconstruction.reshape(1, height);
       if (result.channels() == 1)
       {
           normalize(result, reconstruction, 0, 255, NORM_MINMAX, CV_8SC1);
       }
       else if (result.channels() == 3)
       {
           normalize(result, reconstruction, 0, 255, NORM_MINMAX, CV_8SC3);
       }

       char winTile[128];
       sprintf_s(winTile, "recon_face_%d", num);
       imshow(winTile, reconstruction);
   }
   waitKey(0);
   return 0;
}

P141 FisherFace算法人脸识别

教学视频上的FisherFace算法人脸识别代码：

#include <opencv2/opencv.hpp>
#include <opencv2/face.hpp>
#include <iostream>
#include "opencv2/core/core.hpp"
#include "opencv2/highgui/highgui.hpp"

using namespace cv;
using namespace cv::face;
using namespace std;

   Mat testSample = images[images.size() - 1];//假设将最后一个照片作为要识别的对象
   int testLabel = labels[labels.size() - 1];
   images.pop_back();
   labels.pop_back();

   //train it
   Ptr<BasicFaceRecognizer> model = FisherFaceRecognizer::create();
   model->train(images, labels);

   //recognition face
   int predictedLabel = model->predict(testSample);
   printf("catual label :%d, predict label :%d\n", testLabel, predictedLabel);

   // shouw eigen faces
   for (int i = 0; i < min(16, W.cols); i++)
   {
       Mat ev = W.col(i).clone();
       Mat grayscale;
       Mat eigenFace = ev.reshape(1, height);
       if (eigenFace.channels() == 1)
       {
           normalize(eigenFace, grayscale, 0, 255, NORM_MINMAX, CV_8UC1);
       }
       else if (eigenFace.channels() == 3)
       {
           normalize(eigenFace, grayscale, 0, 255, NORM_MINMAX, CV_8UC3);
       }
       Mat colorface;
       applyColorMap(grayscale, colorface, COLORMAP_BONE);
       char winTitle[128];
       sprintf_s(winTitle, "eigenface_%d", i);
       imshow(winTitle, colorface);
   }

   //重建人脸
   for (int num =0; num < min(W.cols, 16); num ++)
   {
       Mat evs = W.col(num);
       Mat projection = LDA::subspaceProject(evs, mean, images[0].reshape(1, 1));
       Mat reconstruction = LDA::subspaceReconstruct(evs, mean, projection);

       char winTile[128];
       sprintf_s(winTile, "recon_face_%d", num);
       imshow(winTile, reconstruction);
   }
   waitKey(0);
   return 0;
}

P142 LBPH算法人脸识别（整数计算）
CSDN上的LBPH算法人脸识别代码：

#include <opencv2/opencv.hpp>
#include <opencv2/face.hpp>
#include <iostream>

using namespace std;
using namespace cv;
using namespace cv::face;

//OpenCV人脸识别https://www.cnblogs.com/guoming0000/archive/2012/09/27/2706019.html
int main(int argc, char** argv)
{
   String filename = string("D:/OpenCV/orl_faces/image.txt");//标签Label_Text文件
   //从硬盘到内存
   ifstream file(filename.c_str(), ifstream::in); // 函数可用可不用，无需返回一个标准C类型的字符串
       if (!file)//打开标签文件失败
       {
           cout << "could not load label_file" << endl;
           return -1;
       }

   string line, path, classlabel;
   vector<Mat> images;//存放图像数据
   vector<int> labels;//存放图像标签
   char separator = ';';//分号

   while (getline(file, line)) //getline(cin,inputLine)//cin 是正在读取的输入流,而 inputLine 是接收输入字符串的 string 变量的名称
   {
       stringstream liness(line);//这里采用stringstream主要作用是做字符串的分割
       getline(liness, path, separator);//遇到分号就结束
       getline(liness, classlabel);//继续从分号后面开始,遇到换行结束
       if (!path.empty() && !classlabel.empty())
       {
           images.push_back(imread(path, 0));//imread(path,0)//0不能去
           labels.push_back(atoi(classlabel.c_str()));//atoi字符串转换成整型数
       }
   }

   if (images.size() <= 1 || labels.size() <= 1)//如果没有读到足够多的图片
   {
       cout << "读取图片数据失败..." << endl;
   }

   int height = images[0].rows; //得到第一张图片的高度，在下面对图像变形得到他们原始大小时需要
   int width = images[0].cols;
   cout << "读取的图片高度为:" << height << endl << "读取的图片宽度为:" << width << endl;

   //从数据集中移除最后一张图片,用于做测试,需要根据自己的需要进行修改
   Mat testSample = images[images.size() - 2];//获取最后一张照片
   int testLabel = labels[labels.size() - 2];//获取最后一个标签
   images.pop_back();//移除最后一张图片
   labels.pop_back();//移除最后一个标签

   //lbphfaces
   Ptr<LBPHFaceRecognizer> model = LBPHFaceRecognizer::create();
   model->train(images, labels);

   //对测试图像进行预测,predictedLabel是预测标签结果
   int predictedLabel = model->predict(testSample);
   cout << "actual label:   " << testLabel << endl;
   cout << "predict label:   " << predictedLabel << endl;

   //输出LBPH算法参数
   cout << "radius:   " << model->getRadius() << endl;//中心像素点到周围像素点的距离
   cout << "neighb:   " << model->getNeighbors() << endl;//周围像素点的个数
   cout << "grid_x:   " << model->getGridX() << endl;//将一张图片在x方向分成几块
   cout << "grid_y:   " << model->getGridY() << endl;//将一张图片在y方向分成几块
   cout << "thresh:   " << model->getThreshold() << endl;//相似度阈值

   //样本的直方图的长度
   vector<Mat> histograms = model->getHistograms();
   cout << "Size of the histograms: " << histograms[0].total() << endl;

waitKey(0);
return 0;
}

P143-P144实时人脸识别应用开发案例******实际项目可考虑
实时人脸识别应用开发案例教学视频代码：

A：步骤1：采集人脸数据代码：

#include <opencv2/opencv.hpp>
#include <iostream>

using namespace cv;
using namespace std;

string haar_face_datapath = "D:/Opencv3.4.6_build/install/etc/haarcascades/haarcascade_frontalface_alt_tree.xml";

int main(int agrc, char** agrv)
{
   VideoCapture capture(0);//open camers
   if (!capture.isOpened())
   {
       printf("could not open camera...\n");
       return -1;
   }
   Size S = Size((int)capture.get(CV_CAP_PROP_FRAME_WIDTH), (int)capture.get(CV_CAP_PROP_FRAME_HEIGHT));
   int fps = capture.get(CV_CAP_PROP_FPS);

CascadeClassifier faceDetector;
faceDetector.load(haar_face_datapath);

   Mat frame;
   namedWindow("camera-demo", CV_WINDOW_AUTOSIZE);
   vector<Rect> faces;
   int count = 0;//采集人脸数据变量
   while (capture.read(frame))
   {
       flip(frame, frame, 1);
       faceDetector.detectMultiScale(frame, faces, 1.01, 1, 0, Size(100, 120), Size(400, 400));
       for (int i = 0; i < faces.size(); i++)
       {
           if (count % 10 == 0)//大约每隔3-5秒可以采集一次
           {
               Mat dst;
               resize(frame(faces[i]), dst, Size(100, 100));//设置好采集的图片大小尺寸
               imwrite(format("D:/OpenCV/YuheFan/face_%d.jpg", count),dst);//保存采集到的照片
           }
           rectangle(frame, faces[i], Scalar(0, 0, 255), 2, 8, 0);
       }

       imshow("camera-demo", frame);
       char c = waitKey(50);
       if (c == 27)
       {
           break;
       }
       count++;

}

   capture.release();
   waitKey(0);
   return 0;
}

B.步骤2，将步骤1生成的图片地址共同存放于同一个.txt文件中

C.步骤3，人脸识别算法重建、训练（算法可用以上三种算法）代码：
#include <opencv2/opencv.hpp>
#include <opencv2/face.hpp>
#include <iostream>
#include "opencv2/core/core.hpp"
#include "opencv2/highgui/highgui.hpp"

using namespace cv;
using namespace cv::face;
using namespace std;

int main(int argc, char** agrv)
{
   string filename = string("D:/OpenCV/YuheFan/image.txt");
   ifstream file(filename.c_str(), ifstream::in);
   if (!file)
   {
       printf("could not load file correctly...\n");
       return -1;
   }

   string line, path, classlabel;
   vector<Mat> images;
   vector<int> labels;
   char separator = ';';
   while (getline(file, line))
   {
       stringstream liness(line);
       getline(liness, path, separator);
       getline(liness, classlabel);
       if (!path.empty() && !classlabel.empty())
       {
           //printf("path:%s\n", path.c_str());
           images.push_back(imread(path, 0));
           labels.push_back(atoi(classlabel.c_str()));
       }
   }
   if (images.size() < 1 || labels.size() < 1)
   {
       printf("invalid image path...\n");
       return -1;
   }

   int height = images[0].rows;
   int width = images[0].cols;
   printf("height:%d,width :%d\n", height, width);

   Mat testSample = images[images.size() - 1];//假设将最后一个照片作为要识别的对象
   int testLabel = labels[labels.size() - 1];
   images.pop_back();
   labels.pop_back();

   //train it
   Ptr<BasicFaceRecognizer> model = EigenFaceRecognizer::create();
   model->train(images, labels);

   //recognition face
   int predictedLabel = model->predict(testSample);
   printf("catual label :%d, predict label :%d\n", testLabel, predictedLabel);

   //重建人脸
   for (int num = min(10, W.cols); num < min(W.cols, 300); num += 15)
   {
       Mat evs = Mat(W, Range::all(), Range(0, num));
       Mat projection = LDA::subspaceProject(evs, mean, images[0].reshape(1, 1));
       Mat reconstruction = LDA::subspaceReconstruct(evs, mean, projection);

       char winTile[128];
       sprintf_s(winTile, "recon_face_%d", num);
       imshow(winTile, reconstruction);
   }
   waitKey(0);
   return 0;
}

D：步骤4，打开摄像头识别代码：

#include <opencv2/opencv.hpp>
#include <opencv2/face.hpp>
#include <iostream>
#include "opencv2/core/core.hpp"
#include "opencv2/highgui/highgui.hpp"

using namespace cv;
using namespace cv::face;
using namespace std;

string haar_face_datapath = "D:/Opencv3.4.6_build/install/etc/haarcascades/haarcascade_frontalface_alt_tree.xml";//人脸检测库
int main(int argc, char** agrv)
{
   string filename = string("D:/OpenCV/YuheFan/image.txt");//由步骤2采集到的图片
   ifstream file(filename.c_str(), ifstream::in);
   if (!file)
   {
       printf("could not load file correctly...\n");
       return -1;
   }

   string line, path, classlabel;
   vector<Mat> images;
   vector<int> labels;
   char separator = ';';
   while (getline(file, line))
   {
       stringstream liness(line);
       getline(liness, path, separator);
       getline(liness, classlabel);
       if (!path.empty() && !classlabel.empty())
       {
           //printf("path:%s\n", path.c_str());
           images.push_back(imread(path, 0));
           labels.push_back(atoi(classlabel.c_str()));
       }
   }
   if (images.size() < 1 || labels.size() < 1)
   {
       printf("invalid image path...\n");
       return -1;
   }

   int height = images[0].rows;
   int width = images[0].cols;
   printf("height:%d,width :%d\n", height, width);

   Mat testSample = images[images.size() - 1];//假设将最后一个照片作为要识别的对象
   int testLabel = labels[labels.size() - 1];
   images.pop_back();
   labels.pop_back();

   //train it--训练算法采用的是EigenFaceRecognizer，也可以采用另外两个算法训练
   Ptr<BasicFaceRecognizer> model = EigenFaceRecognizer::create();
   model->train(images, labels);

   //recognition face
   int predictedLabel = model->predict(testSample);
   printf("catual label :%d, predict label :%d\n", testLabel, predictedLabel);

   //人脸检测，为人脸识别奠定基础
   CascadeClassifier faceDetector;
   faceDetector.load(haar_face_datapath);

   VideoCapture capture(0);//打开摄像头，开始识别喽
   if (!capture.isOpened())
   {
       printf("could not open camera...\n");
       return -1;
   }
   Mat frame;
   namedWindow("face-recognition", CV_WINDOW_AUTOSIZE);
   vector<Rect> faces;
   Mat dst;
   while (capture.read(frame))
   {
       flip(frame, frame, 1);
       faceDetector.detectMultiScale(frame, faces, 1.1, 1, 0, Size(80, 100), Size(380, 400));//设置数字1越大，误识别率越低
       for (int i = 0; i < faces.size(); i++)
       {
           Mat roi = frame(faces[i]);
           cvtColor(roi, dst, COLOR_BGR2GRAY);
           resize(dst, testSample, testSample.size());
           int label = model->predict(testSample);
           rectangle(frame, faces[i], Scalar(255, 0, 0), 2, 8, 0);
           putText(frame, format("%s", (label == 1 ? "YuheFan" : "Unknow")), faces[i].tl(), FONT_HERSHEY_PLAIN, 1.0, Scalar(0, 0, 255), 2, 8);
       }//putText函数参数中的label==数值，数值表示步骤2文件分号后面的数值

       imshow("face-recognition", frame);
       char c = waitKey(10);
       if (c == 27)//按ESC键取消摄像头读取
       {
           break;
       }
   }
   waitKey(0);
   return 0;
}

YOLOV4代码：
#include <iostream>
#include <queue>
#include <iterator>
#include <sstream>
#include <fstream>
#include <iomanip>
#include <chrono>

#include <opencv2/core.hpp>
#include <opencv2/dnn.hpp>
#include <opencv2/dnn/all_layers.hpp>

#include <opencv2/imgproc.hpp>
#include <opencv2/highgui.hpp>

constexpr float CONFIDENCE_THRESHOLD = 0;
constexpr float NMS_THRESHOLD = 0.4;
constexpr int NUM_CLASSES = 80;

// colors for bounding boxes
const cv::Scalar colors[] = {
   {0, 255, 255},
   {255, 255, 0},
   {0, 255, 0},
   {255, 0, 0}
};
const auto NUM_COLORS = sizeof(colors) / sizeof(colors[0]);

int main()
{
   std::vector<std::string> class_names;
   {
       std::ifstream class_file("D:/OpenCV神经网络2/yolo/coco.names");
       if (!class_file)
       {
           std::cerr << "failed to open classes.txt\n";
           return 0;
       }

       std::string line;
       while (std::getline(class_file, line))
           class_names.push_back(line);
   }

cv::VideoCapture source(0);

   auto net = cv::dnn::readNetFromDarknet("D:/OpenCV神经网络2/yolo/yolov4.cfg", "D:/OpenCV神经网络2/yolo/yolov4.weights");
   //net.setPreferableBackend(cv::dnn::DNN_BACKEND_CUDA);
   //net.setPreferableTarget(cv::dnn::DNN_TARGET_CUDA);
   net.setPreferableBackend(cv::dnn::DNN_BACKEND_OPENCV);
   net.setPreferableTarget(cv::dnn::DNN_TARGET_CPU);
   auto output_names = net.getUnconnectedOutLayersNames();

   cv::Mat frame, blob;
   std::vector<cv::Mat> detections;
   while (cv::waitKey(1) < 1)
   {
       source >> frame;
       if (frame.empty())
       {
           cv::waitKey();
           break;
       }

       auto total_start = std::chrono::steady_clock::now();
       cv::dnn::blobFromImage(frame, blob, 0.00392, cv::Size(416, 416), cv::Scalar(), true, false, CV_32F);
       net.setInput(blob);

       auto dnn_start = std::chrono::steady_clock::now();
       net.forward(detections, output_names);
       auto dnn_end = std::chrono::steady_clock::now();

       std::vector<int> indices[NUM_CLASSES];
       std::vector<cv::Rect> boxes[NUM_CLASSES];
       std::vector<float> scores[NUM_CLASSES];

       for (auto& output : detections)
       {
           const auto num_boxes = output.rows;
           for (int i = 0; i < num_boxes; i++)
           {
               auto x = output.at<float>(i, 0) * frame.cols;
               auto y = output.at<float>(i, 1) * frame.rows;
               auto width = output.at<float>(i, 2) * frame.cols;
               auto height = output.at<float>(i, 3) * frame.rows;
               cv::Rect rect(x - width / 2, y - height / 2, width, height);

               for (int c = 0; c < NUM_CLASSES; c++)
               {
                   auto confidence = *output.ptr<float>(i, 5 + c);
                   if (confidence >= CONFIDENCE_THRESHOLD)
                   {
                       boxes[c].push_back(rect);
                       scores[c].push_back(confidence);
                   }
               }
           }
       }

for (int c = 0; c < NUM_CLASSES; c++)
cv::dnn::NMSBoxes(boxes[c], scores[c], 0.0, NMS_THRESHOLD, indices[c]);

       for (int c = 0; c < NUM_CLASSES; c++)
       {
           for (size_t i = 0; i < indices[c].size(); ++i)
           {
               const auto color = colors[c % NUM_COLORS];

               auto idx = indices[c][i];
               const auto& rect = boxes[c][idx];
               cv::rectangle(frame, cv::Point(rect.x, rect.y), cv::Point(rect.x + rect.width, rect.y + rect.height), color, 3);

               std::ostringstream label_ss;
               label_ss << class_names[c] << ": " << std::fixed << std::setprecision(2) << scores[c][idx];
               auto label = label_ss.str();

               int baseline;
               auto label_bg_sz = cv::getTextSize(label.c_str(), cv::FONT_HERSHEY_COMPLEX_SMALL, 1, 1, &baseline);
               cv::rectangle(frame, cv::Point(rect.x, rect.y - label_bg_sz.height - baseline - 10), cv::Point(rect.x + label_bg_sz.width, rect.y), color, cv::FILLED);
               cv::putText(frame, label.c_str(), cv::Point(rect.x, rect.y - baseline - 5), cv::FONT_HERSHEY_COMPLEX_SMALL, 1, cv::Scalar(0, 0, 0));
           }
       }

auto total_end = std::chrono::steady_clock::now();

       float inference_fps = 1000.0 / std::chrono::duration_cast<std::chrono::milliseconds>(dnn_end - dnn_start).count();
       float total_fps = 1000.0 / std::chrono::duration_cast<std::chrono::milliseconds>(total_end - total_start).count();
       std::ostringstream stats_ss;
       stats_ss << std::fixed << std::setprecision(2);
       stats_ss << "Inference FPS: " << inference_fps << ", Total FPS: " << total_fps;
       auto stats = stats_ss.str();

       int baseline;
       auto stats_bg_sz = cv::getTextSize(stats.c_str(), cv::FONT_HERSHEY_COMPLEX_SMALL, 1, 1, &baseline);
       cv::rectangle(frame, cv::Point(0, 0), cv::Point(stats_bg_sz.width, stats_bg_sz.height + 10), cv::Scalar(0, 0, 0), cv::FILLED);
       cv::putText(frame, stats.c_str(), cv::Point(0, stats_bg_sz.height + 5), cv::FONT_HERSHEY_COMPLEX_SMALL, 1, cv::Scalar(255, 255, 255));

       cv::namedWindow("output");
       cv::imshow("output", frame);
   }

return 0;
}

darknet.exe detector test cfg/coco.data cfg/yolov4.cfg weights/yolov4.weights data/dog.jpg
cd darknet-master\build\darknet\x64

#include <iostream>
#include <iomanip>
#include <string>
#include <vector>
#include <queue>
#include <fstream>
#include <thread>
#include <future>
#include <atomic>
#include <mutex> // std::mutex, std::unique_lock
#include <cmath>

// It makes sense only for video-Camera (not for video-File)
// To use - uncomment the following line. Optical-flow is supported only by OpenCV 3.x - 4.x
//#define TRACK_OPTFLOW
//#define GPU

// To use 3D-stereo camera ZED - uncomment the following line. ZED_SDK should be installed.
//#define ZED_STEREO

#include "yolo_v2_class.hpp" // imported functions from DLL

#ifdef OPENCV
#ifdef ZED_STEREO
#include <sl/Camera.hpp>
#if ZED_SDK_MAJOR_VERSION == 2
#define ZED_STEREO_2_COMPAT_MODE
#endif

#undef GPU // avoid conflict with sl::MEM::GPU

#ifdef ZED_STEREO_2_COMPAT_MODE
#pragma comment(lib, "sl_core64.lib")
#pragma comment(lib, "sl_input64.lib")
#endif
#pragma comment(lib, "sl_zed64.lib")

float getMedian(std::vector<float> &v) {
   size_t n = v.size() / 2;
   std::nth_element(v.begin(), v.begin() + n, v.end());
   return v[n];
}

std::vector<bbox_t> get_3d_coordinates(std::vector<bbox_t> bbox_vect, cv::Mat xyzrgba)
{
   bool valid_measure;
   int i, j;
   const unsigned int R_max_global = 10;

std::vector<bbox_t> bbox3d_vect;

for (auto &cur_box : bbox_vect) {

       const unsigned int obj_size = std::min(cur_box.w, cur_box.h);
       const unsigned int R_max = std::min(R_max_global, obj_size / 2);
       int center_i = cur_box.x + cur_box.w * 0.5f, center_j = cur_box.y + cur_box.h * 0.5f;

       std::vector<float> x_vect, y_vect, z_vect;
       for (int R = 0; R < R_max; R++) {
           for (int y = -R; y <= R; y++) {
               for (int x = -R; x <= R; x++) {
                   i = center_i + x;
                   j = center_j + y;
                   sl::float4 out(NAN, NAN, NAN, NAN);
                   if (i >= 0 && i < xyzrgba.cols && j >= 0 && j < xyzrgba.rows) {
                       cv::Vec4f &elem = xyzrgba.at<cv::Vec4f>(j, i); // x,y,z,w
                       out.x = elem[0];
                       out.y = elem[1];
                       out.z = elem[2];
                       out.w = elem[3];
                   }
                   valid_measure = std::isfinite(out.z);
                   if (valid_measure)
                   {
                       x_vect.push_back(out.x);
                       y_vect.push_back(out.y);
                       z_vect.push_back(out.z);
                   }
               }
           }
       }

       if (x_vect.size() * y_vect.size() * z_vect.size() > 0)
       {
           cur_box.x_3d = getMedian(x_vect);
           cur_box.y_3d = getMedian(y_vect);
           cur_box.z_3d = getMedian(z_vect);
       }
       else {
           cur_box.x_3d = NAN;
           cur_box.y_3d = NAN;
           cur_box.z_3d = NAN;
       }

bbox3d_vect.emplace_back(cur_box);
}

return bbox3d_vect;
}

cv::Mat slMat2cvMat(sl::Mat &input) {
   int cv_type = -1; // Mapping between MAT_TYPE and CV_TYPE
   if (input.getDataType() ==
#ifdef ZED_STEREO_2_COMPAT_MODE
       sl::MAT_TYPE_32F_C4
#else
       sl::MAT_TYPE::F32_C4
#endif
       ) {
       cv_type = CV_32FC4;
   }
   else cv_type = CV_8UC4; // sl::Mat used are either RGBA images or XYZ (4C) point clouds
   return cv::Mat(input.getHeight(), input.getWidth(), cv_type, input.getPtr<sl::uchar1>(
#ifdef ZED_STEREO_2_COMPAT_MODE
       sl::MEM::MEM_CPU
#else
       sl::MEM::CPU
#endif
       ));
}

cv::Mat zed_capture_rgb(sl::Camera &zed) {
   sl::Mat left;
   zed.retrieveImage(left);
   cv::Mat left_rgb;
   cv::cvtColor(slMat2cvMat(left), left_rgb, CV_RGBA2RGB);
   return left_rgb;
}

cv::Mat zed_capture_3d(sl::Camera &zed) {
   sl::Mat cur_cloud;
   zed.retrieveMeasure(cur_cloud,
#ifdef ZED_STEREO_2_COMPAT_MODE
       sl::MEASURE_XYZ
#else
       sl::MEASURE::XYZ
#endif
   );
   return slMat2cvMat(cur_cloud).clone();
}

static sl::Camera zed; // ZED-camera

#else // ZED_STEREO
std::vector<bbox_t> get_3d_coordinates(std::vector<bbox_t> bbox_vect, cv::Mat xyzrgba) {
return bbox_vect;
}
#endif // ZED_STEREO

#include <opencv2/opencv.hpp> // C++
#include <opencv2/core/version.hpp>
#ifndef CV_VERSION_EPOCH // OpenCV 3.x and 4.x
#include <opencv2/videoio/videoio.hpp>
#define OPENCV_VERSION CVAUX_STR(CV_VERSION_MAJOR)"" CVAUX_STR(CV_VERSION_MINOR)"" CVAUX_STR(CV_VERSION_REVISION)
#ifndef USE_CMAKE_LIBS
#pragma comment(lib, "opencv_world" OPENCV_VERSION ".lib")
#ifdef TRACK_OPTFLOW
/*
#pragma comment(lib, "opencv_cudaoptflow" OPENCV_VERSION ".lib")
#pragma comment(lib, "opencv_cudaimgproc" OPENCV_VERSION ".lib")
#pragma comment(lib, "opencv_core" OPENCV_VERSION ".lib")
#pragma comment(lib, "opencv_imgproc" OPENCV_VERSION ".lib")
#pragma comment(lib, "opencv_highgui" OPENCV_VERSION ".lib")
*/
#endif // TRACK_OPTFLOW
#endif // USE_CMAKE_LIBS
#else // OpenCV 2.x
#define OPENCV_VERSION CVAUX_STR(CV_VERSION_EPOCH)"" CVAUX_STR(CV_VERSION_MAJOR)"" CVAUX_STR(CV_VERSION_MINOR)
#ifndef USE_CMAKE_LIBS
#pragma comment(lib, "opencv_core" OPENCV_VERSION ".lib")
#pragma comment(lib, "opencv_imgproc" OPENCV_VERSION ".lib")
#pragma comment(lib, "opencv_highgui" OPENCV_VERSION ".lib")
#pragma comment(lib, "opencv_video" OPENCV_VERSION ".lib")
#endif // USE_CMAKE_LIBS
#endif // CV_VERSION_EPOCH

using namespace std;
vector<string> split(const string&s, char sepeartor)
{
   vector<string> split_vector;
   int subinit = 0;
   for (int id = 0; id != s.length(); id++)
   {
       if (s[id] == sepeartor)
       {
           split_vector.push_back(s.substr(subinit, id - subinit));
           subinit = id + 1;
       }
   }
   split_vector.push_back(s.substr(subinit, s.length() - subinit));
   return split_vector;
}

void draw_boxes(cv::Mat mat_img, std::vector<bbox_t> result_vec, std::vector<std::string> obj_names,
int current_det_fps = -1, int current_cap_fps = -1)
{
int const colors[6][3] = { { 1,0,1 },{ 0,0,1 },{ 0,1,1 },{ 0,1,0 },{ 1,1,0 },{ 1,0,0 } };

   for (auto &i : result_vec) {
       cv::Scalar color = obj_id_to_color(i.obj_id);
       cv::rectangle(mat_img, cv::Rect(i.x, i.y, i.w, i.h), color, 2);
       if (obj_names.size() > i.obj_id) {
           std::string obj_name = obj_names[i.obj_id];
           if (i.track_id > 0) obj_name += " - " + std::to_string(i.track_id);
           cv::Size const text_size = getTextSize(obj_name, cv::FONT_HERSHEY_COMPLEX_SMALL, 1.2, 2, 0);
           int max_width = (text_size.width > i.w + 2) ? text_size.width : (i.w + 2);
           max_width = std::max(max_width, (int)i.w + 2);
           //max_width = std::max(max_width, 283);
           std::string coords_3d;
           if (!std::isnan(i.z_3d)) {
               std::stringstream ss;
               ss << std::fixed << std::setprecision(2) << "x:" << i.x_3d << "m y:" << i.y_3d << "m z:" << i.z_3d << "m ";
               coords_3d = ss.str();
               cv::Size const text_size_3d = getTextSize(ss.str(), cv::FONT_HERSHEY_COMPLEX_SMALL, 0.8, 1, 0);
               int const max_width_3d = (text_size_3d.width > i.w + 2) ? text_size_3d.width : (i.w + 2);
               if (max_width_3d > max_width) max_width = max_width_3d;
           }

           cv::rectangle(mat_img, cv::Point2f(std::max((int)i.x - 1, 0), std::max((int)i.y - 35, 0)),
               cv::Point2f(std::min((int)i.x + max_width, mat_img.cols - 1), std::min((int)i.y, mat_img.rows - 1)),
               color, CV_FILLED, 8, 0);
           putText(mat_img, obj_name, cv::Point2f(i.x, i.y - 16), cv::FONT_HERSHEY_COMPLEX_SMALL, 1.2, cv::Scalar(0, 0, 0), 2);
           if (!coords_3d.empty()) putText(mat_img, coords_3d, cv::Point2f(i.x, i.y - 1), cv::FONT_HERSHEY_COMPLEX_SMALL, 0.8, cv::Scalar(0, 0, 0), 1);
       }
   }
   if (current_det_fps >= 0 && current_cap_fps >= 0) {
       std::string fps_str = "FPS detection: " + std::to_string(current_det_fps) + " FPS capture: " + std::to_string(current_cap_fps);
       putText(mat_img, fps_str, cv::Point2f(10, 20), cv::FONT_HERSHEY_COMPLEX_SMALL, 1.2, cv::Scalar(50, 255, 0), 2);
   }
}
#endif // OPENCV

void show_console_result(std::vector<bbox_t> const result_vec, std::vector<std::string> const obj_names, int frame_id = -1) {
   if (frame_id >= 0) std::cout << " Frame: " << frame_id << std::endl;
   for (auto &i : result_vec) {
       if (obj_names.size() > i.obj_id) std::cout << obj_names[i.obj_id] << " - ";
       std::cout << "obj_id = " << i.obj_id << ", x = " << i.x << ", y = " << i.y
           << ", w = " << i.w << ", h = " << i.h
           << std::setprecision(3) << ", prob = " << i.prob << std::endl;
   }
}

std::vector<std::string> objects_names_from_file(std::string const filename) {
   std::ifstream file(filename);
   std::vector<std::string> file_lines;
   if (!file.is_open()) return file_lines;
   for (std::string line; getline(file, line);) file_lines.push_back(line);
   std::cout << "object names loaded \n";
   return file_lines;
}

template<typename T>
class send_one_replaceable_object_t {
const bool sync;
std::atomic<T *> a_ptr;
public:

   void send(T const& _obj) {
       T *new_ptr = new T;
       *new_ptr = _obj;
       if (sync) {
           while (a_ptr.load()) std::this_thread::sleep_for(std::chrono::milliseconds(3));
       }
       std::unique_ptr<T> old_ptr(a_ptr.exchange(new_ptr));
   }

   T receive() {
       std::unique_ptr<T> ptr;
       do {
           while (!a_ptr.load()) std::this_thread::sleep_for(std::chrono::milliseconds(3));
           ptr.reset(a_ptr.exchange(NULL));
       } while (!ptr);
       T obj = *ptr;
       return obj;
   }

   bool is_object_present() {
       return (a_ptr.load() != NULL);
   }

send_one_replaceable_object_t(bool _sync) : sync(_sync), a_ptr(NULL)
{}
};

int main(int argc, char *argv[])
{
   std::string names_file = "coco.names";
   std::string cfg_file = "cfg/yolov4.cfg";
   std::string weights_file = "yolov4.weights";
   std::string filename;

   if (argc > 4) { //voc.names yolo-voc.cfg yolo-voc.weights test.mp4
       names_file = argv[1];
       cfg_file = argv[2];
       weights_file = argv[3];
       filename = argv[4];
   }
   else if (argc > 1) filename = argv[1];

float const thresh = (argc > 5) ? std::stof(argv[5]) : 0.2;

Detector detector(cfg_file, weights_file);

   auto obj_names = objects_names_from_file(names_file);
   std::string out_videofile = "result.avi";
   bool const save_output_videofile = false; // true - for history
   bool const send_network = false; // true - for remote detection
   bool const use_kalman_filter = false; // true - for stationary camera

   bool detection_sync = true; // true - for video-file
#ifdef TRACK_OPTFLOW // for slow GPU
   detection_sync = false;
   Tracker_optflow tracker_flow;
   //detector.wait_stream = true;
#endif // TRACK_OPTFLOW

   while (true)
   {
       std::cout << "input image or video filename: ";
       if (filename.size() == 0) std::cin >> filename;
       if (filename.size() == 0) break;

       try {
#ifdef OPENCV
           preview_boxes_t large_preview(100, 150, false), small_preview(50, 50, true);
           bool show_small_boxes = false;

           std::string const file_ext = filename.substr(filename.find_last_of(".") + 1);
           std::string const protocol = filename.substr(0, 7);
           if (file_ext == "avi" || file_ext == "mp4" || file_ext == "mjpg" || file_ext == "mov" || // video file
               protocol == "rtmp://" || protocol == "rtsp://" || protocol == "http://" || protocol == "https:/" || // video network stream
               filename == "zed_camera" || file_ext == "svo" || filename == "web_camera") // ZED stereo camera

           {
               if (protocol == "rtsp://" || protocol == "http://" || protocol == "https:/" || filename == "zed_camera" || filename == "web_camera")
                   detection_sync = false;

               cv::Mat cur_frame;
               std::atomic<int> fps_cap_counter(0), fps_det_counter(0);
               std::atomic<int> current_fps_cap(0), current_fps_det(0);
               std::atomic<bool> exit_flag(false);
               std::chrono::steady_clock::time_point steady_start, steady_end;
               int video_fps = 25;
               bool use_zed_camera = false;

track_kalman_t track_kalman;

#ifdef ZED_STEREO
               sl::InitParameters init_params;
               init_params.depth_minimum_distance = 0.5;
#ifdef ZED_STEREO_2_COMPAT_MODE
               init_params.depth_mode = sl::DEPTH_MODE_ULTRA;
               init_params.camera_resolution = sl::RESOLUTION_HD720;// sl::RESOLUTION_HD1080, sl::RESOLUTION_HD720
               init_params.coordinate_units = sl::UNIT_METER;
               init_params.camera_buffer_count_linux = 2;
               if (file_ext == "svo") init_params.svo_input_filename.set(filename.c_str());
#else
               init_params.depth_mode = sl::DEPTH_MODE::ULTRA;
               init_params.camera_resolution = sl::RESOLUTION::HD720;// sl::RESOLUTION::HD1080, sl::RESOLUTION::HD720
               init_params.coordinate_units = sl::UNIT::METER;
               if (file_ext == "svo") init_params.input.setFromSVOFile(filename.c_str());
#endif
               //init_params.sdk_cuda_ctx = (CUcontext)detector.get_cuda_context();
               init_params.sdk_gpu_id = detector.cur_gpu_id;

               if (filename == "zed_camera" || file_ext == "svo") {
                   std::cout << "ZED 3D Camera " << zed.open(init_params) << std::endl;
                   if (!zed.isOpened()) {
                       std::cout << " Error: ZED Camera should be connected to USB 3.0. And ZED_SDK should be installed. \n";
                       getchar();
                       return 0;
                   }
                   cur_frame = zed_capture_rgb(zed);
                   use_zed_camera = true;
               }
#endif // ZED_STEREO

               cv::VideoCapture cap;
               if (filename == "web_camera") {
                   cap.open(0);
                   cap >> cur_frame;
               }
               else if (!use_zed_camera) {
                   cap.open(filename);
                   cap >> cur_frame;
               }
#ifdef CV_VERSION_EPOCH // OpenCV 2.x
               video_fps = cap.get(CV_CAP_PROP_FPS);
#else
               video_fps = cap.get(cv::CAP_PROP_FPS);
#endif
               cv::Size const frame_size = cur_frame.size();
               //cv::Size const frame_size(cap.get(CV_CAP_PROP_FRAME_WIDTH), cap.get(CV_CAP_PROP_FRAME_HEIGHT));
               std::cout << "\n Video size: " << frame_size << std::endl;

               cv::VideoWriter output_video;
               if (save_output_videofile)
#ifdef CV_VERSION_EPOCH // OpenCV 2.x
                   output_video.open(out_videofile, CV_FOURCC('D', 'I', 'V', 'X'), std::max(35, video_fps), frame_size, true);
#else
                   output_video.open(out_videofile, cv::VideoWriter::fourcc('D', 'I', 'V', 'X'), std::max(35, video_fps), frame_size, true);
#endif

               struct detection_data_t {
                   cv::Mat cap_frame;
                   std::shared_ptr<image_t> det_image;
                   std::vector<bbox_t> result_vec;
                   cv::Mat draw_frame;
                   bool new_detection;
                   uint64_t frame_id;
                   bool exit_flag;
                   cv::Mat zed_cloud;
                   std::queue<cv::Mat> track_optflow_queue;
                   detection_data_t() : exit_flag(false), new_detection(false) {}
               };

               const bool sync = detection_sync; // sync data exchange
               send_one_replaceable_object_t<detection_data_t> cap2prepare(sync), cap2draw(sync),
                   prepare2detect(sync), detect2draw(sync), draw2show(sync), draw2write(sync), draw2net(sync);

std::thread t_cap, t_prepare, t_detect, t_post, t_draw, t_write, t_network;

               // capture new video-frame
               if (t_cap.joinable()) t_cap.join();
               t_cap = std::thread([&]()
               {
                   uint64_t frame_id = 0;
                   detection_data_t detection_data;
                   do {
                       detection_data = detection_data_t();
#ifdef ZED_STEREO
                       if (use_zed_camera) {
                           while (zed.grab() !=
#ifdef ZED_STEREO_2_COMPAT_MODE
                               sl::SUCCESS
#else
                               sl::ERROR_CODE::SUCCESS
#endif
                               ) std::this_thread::sleep_for(std::chrono::milliseconds(2));
                           detection_data.cap_frame = zed_capture_rgb(zed);
                           detection_data.zed_cloud = zed_capture_3d(zed);
                       }
                       else
#endif // ZED_STEREO
                       {
                           cap >> detection_data.cap_frame;
                       }
                       fps_cap_counter++;
                       detection_data.frame_id = frame_id++;
                       if (detection_data.cap_frame.empty() || exit_flag) {
                           std::cout << " exit_flag: detection_data.cap_frame.size = " << detection_data.cap_frame.size() << std::endl;
                           detection_data.exit_flag = true;
                           detection_data.cap_frame = cv::Mat(frame_size, CV_8UC3);
                       }

                       if (!detection_sync) {
                           cap2draw.send(detection_data); // skip detection
                       }
                       cap2prepare.send(detection_data);
                   } while (!detection_data.exit_flag);
                   std::cout << " t_cap exit \n";
               });

               // pre-processing video frame (resize, convertion)
               t_prepare = std::thread([&]()
               {
                   std::shared_ptr<image_t> det_image;
                   detection_data_t detection_data;
                   do {
                       detection_data = cap2prepare.receive();

                       det_image = detector.mat_to_image_resize(detection_data.cap_frame);
                       detection_data.det_image = det_image;
                       prepare2detect.send(detection_data); // detection

                   } while (!detection_data.exit_flag);
                   std::cout << " t_prepare exit \n";
               });

               // detection by Yolo
               if (t_detect.joinable()) t_detect.join();
               t_detect = std::thread([&]()
               {
                   std::shared_ptr<image_t> det_image;
                   detection_data_t detection_data;
                   do {
                       detection_data = prepare2detect.receive();
                       det_image = detection_data.det_image;
                       std::vector<bbox_t> result_vec;

                       if (det_image)
                           result_vec = detector.detect_resized(*det_image, frame_size.width, frame_size.height, thresh, true); // true
                       fps_det_counter++;
                       //std::this_thread::sleep_for(std::chrono::milliseconds(150));

                       detection_data.new_detection = true;
                       detection_data.result_vec = result_vec;
                       detect2draw.send(detection_data);
                   } while (!detection_data.exit_flag);
                   std::cout << " t_detect exit \n";
               });

               // draw rectangles (and track objects)
               t_draw = std::thread([&]()
               {
                   std::queue<cv::Mat> track_optflow_queue;
                   detection_data_t detection_data;
                   do {

                       // for Video-file
                       if (detection_sync) {
                           detection_data = detect2draw.receive();
                       }
                       // for Video-camera
                       else
                       {
                           // get new Detection result if present
                           if (detect2draw.is_object_present()) {
                               cv::Mat old_cap_frame = detection_data.cap_frame; // use old captured frame
                               detection_data = detect2draw.receive();
                               if (!old_cap_frame.empty()) detection_data.cap_frame = old_cap_frame;
                           }
                           // get new Captured frame
                           else {
                               std::vector<bbox_t> old_result_vec = detection_data.result_vec; // use old detections
                               detection_data = cap2draw.receive();
                               detection_data.result_vec = old_result_vec;
                           }
                       }

                       cv::Mat cap_frame = detection_data.cap_frame;
                       cv::Mat draw_frame = detection_data.cap_frame.clone();
                       std::vector<bbox_t> result_vec = detection_data.result_vec;

#ifdef TRACK_OPTFLOW
                       if (detection_data.new_detection) {
                           tracker_flow.update_tracking_flow(detection_data.cap_frame, detection_data.result_vec);
                           while (track_optflow_queue.size() > 0) {
                               draw_frame = track_optflow_queue.back();
                               result_vec = tracker_flow.tracking_flow(track_optflow_queue.front(), false);
                               track_optflow_queue.pop();
                           }
                       }
                       else {
                           track_optflow_queue.push(cap_frame);
                           result_vec = tracker_flow.tracking_flow(cap_frame, false);
                       }
                       detection_data.new_detection = true; // to correct kalman filter
#endif //TRACK_OPTFLOW

                       // track ID by using kalman filter
                       if (use_kalman_filter) {
                           if (detection_data.new_detection) {
                               result_vec = track_kalman.correct(result_vec);
                           }
                           else {
                               result_vec = track_kalman.predict();
                           }
                       }
                       // track ID by using custom function
                       else {
                           int frame_story = std::max(5, current_fps_cap.load());
                           result_vec = detector.tracking_id(result_vec, true, frame_story, 40);
                       }

                       if (use_zed_camera && !detection_data.zed_cloud.empty()) {
                           result_vec = get_3d_coordinates(result_vec, detection_data.zed_cloud);
                       }

                       //small_preview.set(draw_frame, result_vec);
                       //large_preview.set(draw_frame, result_vec);
                       draw_boxes(draw_frame, result_vec, obj_names, current_fps_det, current_fps_cap);
                       //show_console_result(result_vec, obj_names, detection_data.frame_id);
                       //large_preview.draw(draw_frame);
                       //small_preview.draw(draw_frame, true);

                       detection_data.result_vec = result_vec;
                       detection_data.draw_frame = draw_frame;
                       draw2show.send(detection_data);
                       if (send_network) draw2net.send(detection_data);
                       if (output_video.isOpened()) draw2write.send(detection_data);
                   } while (!detection_data.exit_flag);
                   std::cout << " t_draw exit \n";
               });

               // write frame to videofile
               t_write = std::thread([&]()
               {
                   if (output_video.isOpened()) {
                       detection_data_t detection_data;
                       cv::Mat output_frame;
                       do {
                           detection_data = draw2write.receive();
                           if (detection_data.draw_frame.channels() == 4) cv::cvtColor(detection_data.draw_frame, output_frame, CV_RGBA2RGB);
                           else output_frame = detection_data.draw_frame;
                           output_video << output_frame;
                       } while (!detection_data.exit_flag);
                       output_video.release();
                   }
                   std::cout << " t_write exit \n";
               });

               // send detection to the network
               t_network = std::thread([&]()
               {
                   if (send_network) {
                       detection_data_t detection_data;
                       do {
                           detection_data = draw2net.receive();

detector.send_json_http(detection_data.result_vec, obj_names, detection_data.frame_id, filename);

                       } while (!detection_data.exit_flag);
                   }
                   std::cout << " t_network exit \n";
               });

               // show detection
               detection_data_t detection_data;
               do {

                   steady_end = std::chrono::steady_clock::now();
                   float time_sec = std::chrono::duration<double>(steady_end - steady_start).count();
                   if (time_sec >= 1) {
                       current_fps_det = fps_det_counter.load() / time_sec;
                       current_fps_cap = fps_cap_counter.load() / time_sec;
                       steady_start = steady_end;
                       fps_det_counter = 0;
                       fps_cap_counter = 0;
                   }

detection_data = draw2show.receive();
cv::Mat draw_frame = detection_data.draw_frame;

                   //if (extrapolate_flag) {
                   // cv::putText(draw_frame, "extrapolate", cv::Point2f(10, 40), cv::FONT_HERSHEY_COMPLEX_SMALL, 1.0, cv::Scalar(50, 50, 0), 2);
                   //}

cv::imshow("window name", draw_frame);
filename.replace(filename.end() - 4, filename.end(), "_yolov4_out.jpg");

                   int key = cv::waitKey(3); // 3 or 16ms
                   if (key == 'f') show_small_boxes = !show_small_boxes;
                   if (key == 'p') while (true) if (cv::waitKey(100) == 'p') break;
                   //if (key == 'e') extrapolate_flag = !extrapolate_flag;
                   if (key == 27) { exit_flag = true; }

                   //std::cout << " current_fps_det = " << current_fps_det << ", current_fps_cap = " << current_fps_cap << std::endl;
               } while (!detection_data.exit_flag);
               std::cout << " show detection exit \n";

               cv::destroyWindow("window name");
               // wait for all threads
               if (t_cap.joinable()) t_cap.join();
               if (t_prepare.joinable()) t_prepare.join();
               if (t_detect.joinable()) t_detect.join();
               if (t_post.joinable()) t_post.join();
               if (t_draw.joinable()) t_draw.join();
               if (t_write.joinable()) t_write.join();
               if (t_network.joinable()) t_network.join();

break;

           }
           else if (file_ext == "txt") { // list of image files
               std::ifstream file(filename);
               if (!file.is_open()) std::cout << "File not found! \n";
               else
                   for (std::string line; file >> line;) {
                       std::cout << line << std::endl;
                       cv::Mat mat_img = cv::imread(line);
                       std::vector<bbox_t> result_vec = detector.detect(mat_img);
                       show_console_result(result_vec, obj_names);
                       //draw_boxes(mat_img, result_vec, obj_names);
                       //cv::imwrite("res_" + line, mat_img);
                   }

           }
           else { // image file
               // to achive high performance for multiple images do these 2 lines in another thread
               cv::Mat mat_img = cv::imread(filename);
               auto det_image = detector.mat_to_image_resize(mat_img);

               auto start = std::chrono::steady_clock::now();
               std::vector<bbox_t> result_vec = detector.detect_resized(*det_image, mat_img.size().width, mat_img.size().height);
               auto end = std::chrono::steady_clock::now();
               std::chrono::duration<double> spent = end - start;
               std::cout << " Time: " << spent.count() << " sec \n";

               //result_vec = detector.tracking_id(result_vec); // comment it - if track_id is not required
               draw_boxes(mat_img, result_vec, obj_names);
               cv::imshow("window name", mat_img);
               vector<string> filenamesplit = split(filename, '/');
               string endname = filenamesplit[filenamesplit.size() - 1];
               endname.replace(endname.end() - 4, endname.end(), "_yolov4_out.jpg");
               std::string outputfile = "detect_result/" + endname;
               imwrite(outputfile, mat_img);
               show_console_result(result_vec, obj_names);
               cv::waitKey(0);
           }
#else // OPENCV
           //std::vector<bbox_t> result_vec = detector.detect(filename);

           auto img = detector.load_image(filename);
           std::vector<bbox_t> result_vec = detector.detect(img);
           detector.free_image(img);
           show_console_result(result_vec, obj_names);
#endif // OPENCV
       }
       catch (std::exception &e) { std::cerr << "exception: " << e.what() << "\n"; getchar(); }
       catch (...) { std::cerr << "unknown exception \n"; getchar(); }
       filename.clear();
   }

return 0;
}

Qiuyu2550317721

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Opencv C++教学视频源代码整理（2）

P132 CNN模型预测年龄与性别(1)、CSDN上的CNN模型预测年龄与性别代码1：成功，效果一般#include <opencv2/opencv.hpp>#include <opencv2/dnn.hpp>#include <iostream>using namespace cv;using namespace cv::dnn;using namespace std;//人脸检测文件String haar_file = "D:/OpenCV神.
复制链接

扫一扫