浅谈语音质量保障：如何测试 RTC 中的音频质量？

最新推荐文章于 2024-08-17 22:22:11 发布

音视频开发老马

最新推荐文章于 2024-08-17 22:22:11 发布

阅读量959

点赞数 1

分类专栏：音视频开发流媒体服务器 Android音视频开发文章标签：实时音视频音视频 webrtc 语音识别实时互动

本文链接：https://blog.csdn.net/yinshipin007/article/details/125730262

版权

本文探讨了如何测试RTC中的音频质量，包括客观测试（端到端延迟、ANS、AGC、AEC）和主观测试方法。通过使用POLQA、PESQ等标准，结合专家和普通用户的主观评分，来保障音频的听觉质量和3A算法性能，以提升实时音视频会议的语音体验。

摘要由CSDN通过智能技术生成

日常音视频开会中我们或多或少会遭遇这些场景：“喂喂喂，可以听到我说话吗？我听你的声音断断续续的”，“咦，我怎么可以听到回声？”，“太吵啦，我听不清楚你在说啥” 等等。这些语音质量问题影响音视频开会体验，如若是重要的会议，那足够让人 “恼羞成怒”。那么如何有效的减少这些问题发生呢？本系列文章就将为大家分享阿里云视频云在保障 RTC 语音质量方面的测试经验。

背景介绍

音频质量是指正常网络下的听觉质量和音频3A 算法质量。听觉质量，是在无损网络情况下人耳对语音优劣的主观感受。但在实际生活中，不同人对同一声音可能会有不同的优劣判断，另外还会受到收听环境和收听心理影响。在测试时，我们可以从声音三要素：响度、音高、音色纬度出发，对一些指标进行量化评估。另外业内标准还会将这些量化指标通过一定的加权处理以期望拟合主观感受，比如 POLQA、PESQ 等。

音频 3A 算法是指：

AGC: Automatic gain control（自动增益控制）

ANS: Adaptive noise suppression（噪声抑制）

AEC: Acoustic echo cancellation（回声消除）

本系列文章将从音频质量、适配测试、Qos 质量、自动化方案四个纬度去介绍阿里云视频云如何保障 RTC 语音质量，本文先介绍音频质量部分（正常网络下的听觉质量和音频 3A 算法质量）。

RTC 语音测试链路拆解

在正式测试前，我们先了解 RTC 语音传输的整个链路框架图，声音通过麦克风采集，而后上行音频算法进行前处理，编解码传输后通过扬声器播放出来。若想测试上行音频算法可在（1）处输入声音，而后在（2）处拉取输出音频进行分析。系统测试时，我们往往从端到端角度评估，即从（1）处输入声音而后在（4）拉取声音进行分析，本文后续测试方法均基于端到端。