【Telephony 】【Call】音频通话声音问题VM、PCM文件分析（MTK&Unisoc）

孤独的蓝

已于 2024-03-13 12:25:55 修改

阅读量2.2k

点赞数 42

分类专栏： Telephony理论 Telephony实践文章标签：信息与通信网络安卓 android 音频

于 2024-03-11 20:20:44 首次发布

本文链接：https://blog.csdn.net/weixin_44513784/article/details/136633166

版权

本文详细讲述了音频通话技术从2/3G到5G的发展历程，介绍了VoLTE、VoNR等技术，以及MTK和Unisoc平台的语音问题抓取和解析方法。重点讲解了不同网络环境下的语音编码方式、通话问题定位和解决策略。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一.音频通话演变

本节讲述含技术演变、音频格式、以及网络制式各技术名词，读完就能理解下面很多术语。
我认为背景知识必不可少，理论知识是技术基石，所以有必要写一下。

（1）2/3G、4G、5G语音通话

2/3G时代国内是使用CS电路域和PS分组域分别来处理语音业务（打电话）和数据业务（上网），当用户接打电话时，语音业务就会直接抢占数据业务的通路。那时候打电话的时候手机会直接断网，打开网页就是一直转圈圈。
4G时代到了4G早期，这个问题也没有解决，因为4G网络初期并不能实现语音通话，语音业务仍然需走在电路域里。当时的语音解决方案叫做CSFB（即CS FallBack），用户一旦有语音电话，本来在4G的手机就会回落到2/3G进行通话；为了解决这一落差，4G时代后期推出了VoLTE技术，它可以把语音业务封装成IP数据包，通过分组网络传输，而不必再单独建立语音通道，以IP包的形式直接在PS域传输语音数据的控制系统，这套系统叫做IMS。
5G时代 5G早期，为了尽快让大家用上5G，使用的是5G、4G共用核心网资源的NSA非独立组网方案，虽然上网业务使用了5G，但打电话却依然是由VoLTE搞定（EPS fallback）；而现在，有了基于SA独立组网的VoNR，打电话就不用再回退到4G了，语音电话、视频电话都可以跑在5G大带宽上。

（2）通话语音编码方式和速率

VoLTE语音编解码包括AMR-WB/AMR-NB/EVS三种语音编码方式，语音编码速率分别有：
AMR-NB有8种：12.2K、10.2K、7.95K、7.4K、6.7K、5.9K、5.15K、4.75K
AMR-WB有9种：23.85K、23.05K、19.85K、18.25K、15.85K、14.25K、12.65K、8.85K、6.6K
EVS有12种：128K、96K、64K、48K、32K、24.4K、16.4K、13.2K、9.6K、8K、7.2K、5.9K
VoNR采用EVS作为语音编解码。EVS与其他常用语音编码方式（如AMR-WB（adaptive multirate wideband））相比，可以提供更高的语音质量。

（3）通话声音问题引导

在日常生活中，我们的手机通话模式也比较多样化，有听筒模式，扬声器模式，蓝牙耳机模式，蓝牙耳机编解码更加多样复杂，遇到蓝牙耳机通话问题，需BSP模块协助分析，今天咱们主要分析下在听筒模式扬声器模式下遇到通话语音质量问题，如通话无声、通话卡顿、有杂音该怎么分析？该怎么抓取解析audio log来初步判断是网络问题？还是音频问题？还是硬件问题？
在这里插入图片描述