ros编程之opencv基础知识

最新推荐文章于 2025-03-27 20:25:53 发布

elais_h

最新推荐文章于 2025-03-27 20:25:53 发布

阅读量977

点赞数 14

文章标签： opencv 人工智能计算机视觉

本文链接：https://blog.csdn.net/elais_h/article/details/145662786

版权

OpenCV 主要内容概述

OpenCV（Open Source Computer Vision Library） 是一个开源的计算机视觉和机器学习库，包含超过2500种优化算法，广泛应用于图像处理、目标检测、3D重建、AR/VR等领域。其核心模块包括：

核心功能（Core）
- 基础数据结构（Mat图像矩阵、Point、Rect等）
- 基本操作（图像裁剪、通道分离、数学运算）
- 文件I/O（读写图像、视频、XML/YAML文件）
图像处理（Imgproc）
- 滤波（高斯、中值、双边滤波）
- 几何变换（缩放、旋转、仿射变换）
- 阈值处理（二值化、自适应阈值）
- 边缘检测（Canny、Sobel）
- 直方图均衡化、形态学操作（腐蚀、膨胀）
特征检测与描述（Features2D）
- 关键点检测（SIFT、ORB、FAST）
- 特征描述符（SURF、BRIEF）
- 特征匹配（BFMatcher、FLANN）
视频分析（Video）
- 光流法（Lucas-Kanade、Farneback）
- 背景减除（MOG2、KNN）
- 运动跟踪（MeanShift、CamShift）
目标检测与机器学习（Objdetect、ML）
- Haar级联分类器（人脸检测）
- HOG+SVM（行人检测）
- 深度学习集成（YOLO、SSD、DNN模块）
相机标定与3D重建（Calib3D）
- 相机标定（张正友标定法）
- 立体视觉（视差图计算）
- 位姿估计（PnP算法）
GUI与可视化（HighGUI）
- 图像/视频显示窗口
- 交互式控件（滑动条、鼠标事件）

实际开发中的典型问题与解决方案

问题1：图像去噪与增强

场景：图像存在高斯噪声或椒盐噪声，需提高清晰度。
解决方案：

高斯滤波（平滑噪声）：

import cv2
blurred = cv2.GaussianBlur(img, (5,5), 0)  # 核大小(5x5), 标准差自动计算

中值滤波（去除椒盐噪声）：
```
median = cv2.medianBlur(img, 5)
```

直方图均衡化（增强对比度）：

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
equalized = cv2.equalizeHist(gray)

问题2：实时目标检测

场景：在视频流中检测人脸或车辆。
解决方案：

Haar级联检测器（轻量级实时检测）：

face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')
faces = face_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5)
for (x,y,w,h) in faces:
    cv2.rectangle(img, (x,y), (x+w,y+h), (255,0,0), 2)

YOLO深度学习模型（高精度多目标检测）：

net = cv2.dnn.readNet("yolov3.weights", "yolov3.cfg")
layer_names = net.getLayerNames()
output_layers = [layer_names[i[0]-1] for i in net.getUnconnectedOutLayers()]

# 输入预处理
blob = cv2.dnn.blobFromImage(img, 0.00392, (416,416), (0,0,0), True, crop=False)
net.setInput(blob)
outs = net.forward(output_layers)

# 解析检测结果
for detection in outs:
    scores = detection[5:]
    class_id = np.argmax(scores)
    confidence = scores[class_id]
    if confidence > 0.5:
        # 绘制边界框

问题3：相机标定与畸变校正

场景：相机镜头导致图像扭曲，需校正为无畸变图像。
解决方案：

棋盘格标定：

# 寻找棋盘格角点
ret, corners = cv2.findChessboardCorners(gray, (9,6), None)
if ret:
    # 亚像素优化
    cv2.cornerSubPix(gray, corners, (11,11), (-1,-1), criteria)
    objpoints.append(objp)  # 3D点
    imgpoints.append(corners)  # 2D点

# 计算内参和畸变系数
ret, mtx, dist, rvecs, tvecs = cv2.calibrateCamera(objpoints, imgpoints, gray.shape[::-1], None, None)

去畸变：

undistorted = cv2.undistort(img, mtx, dist, None, mtx)

问题4：图像特征匹配与拼接

场景：将多张重叠图像拼接为全景图。
解决方案：

SIFT特征匹配：

sift = cv2.SIFT_create()
kp1, des1 = sift.detectAndCompute(img1, None)
kp2, des2 = sift.detectAndCompute(img2, None)

# FLANN匹配器
FLANN_INDEX_KDTREE = 1
index_params = dict(algorithm=FLANN_INDEX_KDTREE, trees=5)
search_params = dict(checks=50)
flann = cv2.FlannBasedMatcher(index_params, search_params)
matches = flann.knnMatch(des1, des2, k=2)

# 筛选优秀匹配
good = []
for m,n in matches:
    if m.distance < 0.7*n.distance:
        good.append(m)

# 计算单应性矩阵
src_pts = np.float32([kp1[m.queryIdx].pt for m in good]).reshape(-1,1,2)
dst_pts = np.float32([kp2[m.trainIdx].pt for m in good]).reshape(-1,1,2)
H, mask = cv2.findHomography(src_pts, dst_pts, cv2.RANSAC, 5.0)

# 图像拼接
result = cv2.warpPerspective(img1, H, (img1.shape[1]+img2.shape[1], img1.shape[0]))
result[0:img2.shape[0], 0:img2.shape[1]] = img2

问题5：实时视频处理延迟优化

场景：处理高清视频流时帧率过低。
解决方案：

多线程处理：分离图像采集与处理线程。

from threading import Thread
class VideoStream:
    def __init__(self, src=0):
        self.stream = cv2.VideoCapture(src)
        self.grabbed, self.frame = self.stream.read()
        self.stopped = False
    
    def start(self):
        Thread(target=self.update, args=()).start()
        return self
    
    def update(self):
        while not self.stopped:
            if not self.grabbed:
                self.stop()
            else:
                self.grabbed, self.frame = self.stream.read()
    
    def read(self):
        return self.frame
    
    def stop(self):
        self.stopped = True

降低分辨率：

cap.set(cv2.CAP_PROP_FRAME_WIDTH, 640)
cap.set(cv2.CAP_PROP_FRAME_HEIGHT, 480)

硬件加速：使用OpenCV的GPU模块（需CUDA支持）：

gpu_frame = cv2.cuda_GpuMat()
gpu_frame.upload(frame)
gpu_blur = cv2.cuda.createGaussianFilter(cv2.CV_8UC3, cv2.CV_8UC3, (5,5), 0)
blurred = gpu_blur.apply(gpu_frame).download()