python实现onvif协议下控制摄像头变焦,以及融合Mediapipe人形识别与跟踪控制

道1993

已于 2024-11-04 14:11:44 修改

阅读量1.3k

点赞数 12

分类专栏：《计算机视觉》文章标签：人工智能 1024程序员节

于 2024-10-24 17:50:01 首次发布

本文为博主原创文章，未经博主允许不得转载。

本文链接：https://blog.csdn.net/OuNuo5280/article/details/143106833

版权

这两天才因为项目需要，对网络摄像头的视频采集以及实现人形识别与跟踪技术。对于onvif协议自然起先也没有任何的了解。但是购买的摄像头是SONY网络头是用在其他地方的。因为前期支持探究项目解决方案，就直接拿来做demo测试使用。

先说说onvif协议：

Onvif，即Open Network Video Interface Forum ，可以译为开放型网络视频接口论坛，是安迅士、博世、索尼在2008年共同成立的一个国际性、开发型网络视频产品标准网络接口的开发论坛，后来由于这个技术开发论坛共同制定的开发型行业标准，就用该论坛的大写字母命名，即ONVIF 网络视频标准规范，习惯简称为：ONVIF协议。

Onvif协议的出现，解决了不同厂商之间开发的各类失败不能融合使用的难题，提供了统一的网络视频开发标准，即最终能够通过Onvif这个标准化的平台实现不同产品之间的集成。

onvif Device test tool工具测试

python实现步骤

安装必要的库
- 使用 pip install onvif 安装 ONVIF 库。
- 根据人形识别所用的库进行安装，比如使用 pip install volo（假设使用 volo 进行人形识别）。
初始化 ONVIF 摄像头
- 设置摄像头的 IP 地址、端口、用户名和密码等参数。
- 创建 ONVIFCamera 对象并更新其地址。
- 获取 PTZ（Pan/Tilt/Zoom）服务，用于控制摄像头的云台和变焦。
实现摄像头变焦控制
- 定义变焦速度等参数。
- 通过调用 PTZ 服务的相关方法实现拉近（zoom in）、拉远（zoom out）和停止变焦操作。
人形识别与跟踪
- 使用选定的人形识别库加载模型并进行图像分析。
- 在视频流中检测人形，获取人形的位置信息。
- 根据人形位置调整摄像头的云台和变焦，实现跟踪。

完整代码

import cv2
import numpy as np
import serial
from onvif import ONVIFCamera
import time
import asyncio
from zeep import Client
import tkinter as tk
from threading import Thread
import logging

logging.basicConfig(level=logging.DEBUG)

# 摄像头配置常量
CAMERA_IP = "192.168.0.132"
CAMERA_PORT = 8080
CAMERA_USERNAME = "admin"
CAMERA_PASSWORD = "*****"

# 串口配置常量
SERIAL_PORT = 'COM4'
BAUDRATE = 115200

# 初始化串口
ser = serial.Serial(SERIAL_PORT, BAUDRATE)

# 初始化摄像头
camera = None
try:
    camera = ONVIFCamera(CAMERA_IP, CAMERA_PORT, CAMERA_USERNAME, CAMERA_PASSWORD)
    camera.update_xaddrs()
  
except Exception as e:
    logging.error(f"初始化摄像机错误: {e}")
# 获取 PTZ 服务
def get_ptz_service(camera):
    try:
        if camera:
            return camera.create_ptz_service()
        else:
            print("摄像机未初始化.")
            return None
    except Exception as e:
        print(f"PTZ 服务初始化错误: {e}")
        return None
ptz_service = get_ptz_service(camera)
# ONVIF摄像头设置
def get_stream_url():
    if camera:
        media_service = camera.create_media_service()
        return media_service.GetStreamUri({
            'StreamSetup': {
                'Stream': 'RTP-Unicast',
                'Transport': {'Protocol': 'RTSP'}
            },
            'ProfileToken': camera.media.GetProfiles()[0].token
        }).Uri
    else:
        return None
async def process_video_async(cap):
    while True:
        ret, frame = cap.read()
        if not ret:
            print("视频读取失败")
            break

        resized_frame = cv2.resize(frame, (899, 600))
        cv2.imshow('Video', resized_frame)
        if cv2.waitKey(1) & 0xFF == ord('q'):
            break
        await asyncio.sleep(0)

def start_video_processing():
    stream_url = get_stream_url()
    if stream_url:
        cap = cv2.VideoCapture(stream_url)
        cap.set(cv2.CAP_PROP_FPS, 30)
        asyncio.run(process_video_async(cap))
        cap.release()
    else:
        print("无法获取视频流 URL。")
# 摄像头控制
class CameraControl:
    def __init__(self, ptz_service, camera):
        self.ptz_service = ptz_service
        self.zoom_speed = 0.1
        self.camera_profile_token = 'P2'

    def zoom_in(self):
        try:
            if self.camera_profile_token and 'P2':
                self.ptz_service.ContinuousMove({
                    'ProfileToken': 'P2',
                    'Velocity': {
                     'PanTilt': {'x': 0.0, 'y': 0.0},
                     'Zoom': {'x': self.zoom_speed}
                    }
                })
                print("拉近操作进行中")
            else:
                print("摄像头或 PTZ 服务未正确初始化。")
        except