AI视频行为分析系统项目复盘——技术篇2：视频流GPU硬解码

最新推荐文章于 2024-06-13 09:58:21 发布

⊙月

最新推荐文章于 2024-06-13 09:58:21 发布

阅读量1.5k

点赞数 1

分类专栏：项目复盘

本文链接：https://blog.csdn.net/weixin_42118657/article/details/118224975

版权

6 篇文章 1 订阅

订阅专栏

0 项目背景

见《AI视频行为分析系统项目复盘——技术篇1》

原因提炼如下：

CPU利用率冲顶，而GPU利用率低：视频流的解码工作，一般视频处理函数库由于历史原因，默认使用CPU解码视频流，但如果要实时解码多路视频流，CPU的计算资源将耗费非常严重。这种情况下，服务器内的CPU会经常感觉不够用成为瓶颈，但是与此同时，GPU的利用率通常还很低。导致GPU利用率低原因如下：
1. DL工程一般数据流如下：CPU解码视频（费时间）→ CPU各种预处理图片（费时间）→图片从内存拷贝到GPU显存中（费时间）→GPU推理图片（一般的DL模型任务，速度非常快），即便采用数据缓冲池等操作，但很多时候再昂贵的CPU也赶不上GPU推理图片速度。
2. GPU近些年来的硬件能力进步速度远超过CPU，而且相关GPU推理加速优化方法也进展迅速。两者任务量不变的情况下，GPU相对CPU经常大大超前完成任务。
GPU相对CPU天生更擅长解码工作：虽然CPU内也有核显，但相对GPU还是小了点。

本文等下说的是PC机内DL开发中的主要方法，其他情况下需要更多的跟踪调研，比如手机芯片中，有非常专用的视频解码单元、音频解码单元等等。

通常的方法如下：

OpenCV中的硬解码：由cv::gpu::VideoReader_GPU完成。（当前不支持RTSP视频流解码）
ffmpeg + CUVID：FFmpeg是一套可以用来记录、转换数字音频、视频，并能将其转化为流的开源程序。CUVID是基于CUDA的视频解码库。FFmpeg编码库可以使用GPU加速。
deepstream方案：NVIDIA推出的一整套工具，包含解码、预处理和推理，一般推荐直接用这个。但是其灵活性在某些场景可能目前还不够，具体参考：《深兰科技|硬编解码技术的AI应用》