英伟达Tesla T4 显卡编解码能力测试

最新推荐文章于 2025-04-20 11:17:27 发布

泰勒朗斯

最新推荐文章于 2025-04-20 11:17:27 发布

阅读量1.2w

点赞数 3

分类专栏：音视频编解码文章标签： c语言

本文链接：https://blog.csdn.net/weixin_43360707/article/details/119947027

版权

音视频编解码专栏收录该内容

51 篇文章

订阅专栏

本文分析了一项针对GPU视频处理的性能测试，发现在200路视频流处理中，帧率较低，GPU利用率不饱和，而颜色空间转换成为性能瓶颈。每张显卡理论上可处理约20路1.0Mbps的视频流，但实际颜色空间转换限制了效率。优化颜色空间转换是提升GPU视频处理能力的关键。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

显卡基本参数：

Timestamp : Fri Aug 27 10:04:12 2021
Driver Version : 460.32.03 CUDA Version 11.2
Attached GPUs : 8

FB Memory
Total : 15109 MiB
BAR1 Memory Usage
Total : 256 MiB

Architecture:        x86_64
CPU op-mode(s):      32-bit, 64-bit
Byte Order:          Little Endian
CPU(s):              64
On-line CPU(s) list: 0-63
Thread(s) per core:  2
Core(s) per socket:  16
Socket(s):           2
NUMA node(s):        2
Vendor ID:           GenuineIntel
CPU family:          6
Model:               85
Model name:          Intel(R) Xeon(R) Gold 5218 CPU @ 2.30GHz
Stepping:            7
CPU MHz:             1000.014
BogoMIPS:            4600.00
Virtualization:      VT-x
L1d cache:           32K
L1i cache:           32K
L2 cache:            1024K
L3 cache:            22528K
NUMA node0 CPU(s):   0-15,32-47
NUMA node1 CPU(s):   16-31,48-63

输入： IPC摄像头 Rtsp
分辨率：2560*1440
码流：0.8M/bs
编码：h264

输出：Rtsp
分辨率：1920*1080
码流：0.4M/bs
编码：h264

操作流程：
拉流->解码->YUV2RGB->RGB2YUV->编码
因为解码后颜色空间是YUV如果想进行下一步图像处理，必须将颜色空间转换为BRG方可进行主流图片业务处理。

首先我们放入200路视频进行测试：
用dstat命令后可以看到，输入在150Mb。
在这里插入图片描述
接着查看帧率：
发现帧率非常低，只有11帧上下

继续看GPU情况：
GPU利用率只有一半过一点。

打开一路编解码会话就会占用一定GPU内存，所以编解码的另外一个限制是GPU显存的大小，英伟达官网有一篇论文阐述了这个问题
https://developer.nvidia.com/blog/optimizing-video-memory-usage-with-the-nvdecode-api-and-nvidia-video-codec-sdk/
论文名字：Optimizing Video Memory Usage with the NVDECODE API and NVIDIA Video Codec SDK
在这里插入图片描述
上面就是关于显存对于编解码的占用大小表格。