PCM是什么数据格式?什么是PCM 是一种无损音频数据格式

在你贴出的代码中,PCM 是一种音频数据格式,全称是:

Pulse-Code Modulation(脉冲编码调制)


🎧 什么是 PCM?

PCM 是最原始、最纯净的音频数据格式,表示从麦克风录制的未经压缩的数字音频。简单来说,它是一种:

  • 不带压缩的

  • 连续采样的

  • 高质量的

  • 可直接被数字音频系统处理的

音频数据格式。


📦 在代码中体现在哪?

你在代码中看到多处使用了 PCM 相关设置,例如:

int audioFormat = AudioFormat.ENCODING_PCM_16BIT;

表示音频数据使用的是 16位 PCM 编码

又比如:

audio.addProperty("format", "pcm");
audio.addProperty("codec", "raw");

这些 JSON 是传给火山语音识别接口的,用来告诉服务端:“我发过来的音频是 PCM 格式的”。


🔄 PCM 与 MP3、WAV 的区别

格式是否压缩常见用途大小
PCM❌ 无压缩原始音频采样、语音识别、音频处理大(最原始)
MP3✅ 有压缩(有损)音乐、传输
WAV❌ / ✅容器格式,通常封装 PCM中等

🎯 为什么语音识别要用 PCM?

语音识别服务(如火山引擎的 ASR)通常要求传入的音频是 PCM 格式,因为:

  1. 质量更高,没有压缩损失;

  2. 结构简单,利于算法提取特征;

  3. 易于处理,没有解码复杂性。


🔧 举例:录音数据传输流程

  1. 麦克风采集的是模拟信号;

  2. AudioRecord 采样后会生成 PCM 数据;

  3. PCM 数据作为 byte[] 被封装成 WebSocket 消息;

  4. 服务端(火山语音识别接口)接收并解码处理,识别语音内容。


✅ 总结:

  • PCM = Pulse-Code Modulation,是一种无压缩的数字音频格式

  • 代码中使用 PCM 是为了和语音识别系统兼容;

  • 你用 AudioRecord 获取的音频数据就是 PCM 格式;

  • PCM 是语音识别中最常用和推荐的输入格式。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值