【C语言】PCM音频数据处理---左右声道分离

最新推荐文章于 2025-06-11 15:27:37 发布

Timsley

最新推荐文章于 2025-06-11 15:27:37 发布

阅读量1.3w

点赞数 6

CC 4.0 BY-SA版权

分类专栏： C语言文章标签： c语言 PCM

本文链接：https://blog.csdn.net/timsley/article/details/50682992

我用一麦克风录制的PCM数据是16bit，双声道的，用Audacity工具查看可知，右声道是没有声音的，左声道才有声音，如下图所示
这里写图片描述

所以为了节省存储空间，完全可以将左右声道分离出来，左右声道分离的方法很简单，只要知道PCM数据是如何存储的，就可以了，具体存储格式如下
这里写图片描述

根据上图可以得出，如果我们想要分离左右声道，只要将对应声道的数据保存起来即可，由于我录制的PCM是裸数据，所以直接用文件读写操作去处理。具体实现如下

C语言实现

#define FALSE 0
#define TRUE 1

#define OLD_FILE_PATH "old.pcm"
#define LEFT_FILE_PATH "left.pcm"
#define RIGHT_FILE_PATH "right.pcm"


void pcm_lr_separate(void)
{
    char buf[16

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Timsley

关注关注

6
点赞
踩
29

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【音视频数据数据处理 8】【PCM篇】分离双声道PCM的左右声道数据

|~~~热爱生活、努力学习的小伙汁~~~|

08-28

2199

【音视频数据数据处理 8】【PCM篇】分离PCM16LE的左右声道数据本文开始学习使用C语言处理PCM文件。如果没有PCM的同学可以使用 ffmpeg 来进行转换： ffmpeg命令：wav转pcm: ffmpeg -i input.wav -f s16le -ar 16000 -ac 1 -acodec pcm_s16le output.pcm ffmpeg命令：pcm转wav: ffmpeg -i input.pcm -f s16le -ar 16000 -ac 2 -acodec pcm_s16l

PCM双声道分离为单声道 C++ 实现

最新发布

超级大帅哥

06-11

199

在Android中把MP3转换成PCM格式音频，分离左右声道，并播放左右声道。

c 语言提取左右声道数据

weixin_43138570的博客

03-10

929

注意：本例子针对的输入数据源是双声道数据，采样点格式为s16le，如果是其他格式，比如24bit或者32bit或者其他，需要针对性的修改每次读取的字节数，也就是read(fd, &num, 4)，对应num类型也要针对性修改，以便于能够容纳左右声道数据。 #include <math.h> #include <sys/types.h> #include <sy...

VC++分离WAV立体声为左右两个单独声道

03-15

内容索引:VC/C++源码,多媒体技术,立体声,声道　　VC++分离立体声音乐为左右两个单独声道，请注意打开WAV格式的文件效果最好了，分离后直接调用Media Player进行播放，而且效果不错，分离的确实干净，这样你在编写KTV程序的时候就不用发愁了，本人研究了半个月才搞定的，虽然只完成了这么一个功能。

基于C的双声道PCM文件数据处理

Ivy9808的博客

03-23

1581

本次练习要求：将单声道origin_audio.pcm音频文件存入到双声道two_channel_audio.pcm的左声道中，将音量调节后的文件存入到右声道中。如何将数据分别存储到左、右声道中，首先要了解16位双声道PCM数据的存储格式，如下：左声道低字节-左声道高字节-右声道低字节-右声道高字节…，因此构成双通道时先以 2个字节写入左声道内容以构成左声道的数据，再以2个字节写入右声道内容以构成右声道数据。以下为不同声道PCM的数据存储格式：本次code将fopen替换为fopen_s 代码实现

pcm 降采样_视音频数据处理入门：PCM音频采样数据处理

weixin_31134719的博客

01-17

757

=====================================================视音频数据处理入门系列文章：=====================================================上一篇文章记录了RGB/YUV视频像素数据的处理方法，本文继续上一篇文章的内容，记录PCM音频采样数据的处理方法。音频采样数据在视频播放器的解码流程中的位置如下...

使用C语言实现从一段pcm格式音频文件中截取一段数据

hlj_include的博客

08-05

5050

//Time:2016/08/04 #include #include int main (void) { unsigned char* psTest = (unsigned char*)malloc(2); //截取数据的缓冲区 int tmp = 0; int begin_time = 0; //开始截取的位置 int run_time = 0; //

C ++版本的人声分离模型

weixin_42611177的博客

01-04

355

C语言版本的人声分离模型是指使用C语言实现的人声分离技术。人声分离是指将混合在一起的声音信号中的人声信号和其他声源信号分离出来的过程。这种技术通常用于音乐和视频制作中，可以让用户将人声和背景音乐分开，方便进行后期处理。 ...

PCM音频处理一：分离左右声道音频

WHEgqing的专栏

08-15

4430

本文介绍了将PCM16LE双声道数据中左声道和右声道的数据分离成两个文件，PCM音频数据可以使用音频编辑软件导入查看，推荐免费开源的音频编辑软件Audacity。本文参考文献链接：https://blog.csdn.net/leixiaohua1020/article/details/50534316 PCM16LE简介 PCM16LE双声道数据中左声道和右声...

C 版本的人声分离模型

weixin_42608299的博客

01-04

215

C 版本的人声分离模型是指使用 C 语言实现的人声分离模型。人声分离是指从音频中分离出人声的过程，通常用于将人声从背景噪声中分离出来，使得人声更加清晰。可以使用 C 语言实现人声分离模型，但需要有一定的信号处理和机器学习知识。 ...

给我推荐比较流行的C++版本的人声分离模型

weixin_35755823的博客

01-04

644

下面是一些比较流行的 C 版本的人声分离模型： Deep Learning Toolkit for Audio (DLTK): 这是一个开源的人声分离模型，使用 TensorFlow 和 Python 实现。 Open-Unmix: 这是一个使用 PyTorch 和 Python 实现的开源的人声分离模型。 Demucs: 这是一个使用 Python 和 TensorFlow 实现的开源的人...

PCM裸流数据的16进制格式以及左右声道分离c语言程序

唐传林的博客

04-12

2638

前言本文讲解PCM裸流数据的存储格式。本文PCM音频参数声道数： 2 采样位数： little endian signed 16 bits，小端有符号字 = short，表示范围 -32768~32767 采样频率： 44100Hz PCM数据存储格式（小端有符号字） UltraEdit下查看实际的16进制数据（小端有符号字）注意：在notepad++下...

VC++之多媒体编程之左右声道控制

Augusdi的专栏

04-04

4562

一、创建对话框应用程序二、编辑对话框资源控件ID与标题（红色部分）IDC_SLIDER_LEFT （左声道控制滑块）IDC_SLIDER_RIGHT （右声道控制滑块）IDOK 退出三、

【音视频数据数据处理 9】【PCM篇】修改PCM左/右声道音量，转换PCM16为PCM8格式

|~~~热爱生活、努力学习的小伙汁~~~|

08-28

1400

【音视频数据数据处理 9】【PCM篇】修改PCM左/右声道音量，修改PCM的采样率一、修改PCM左/右声道音量二、修改PCM16为PCM8采样精度本文接着前文：《【音视频数据数据处理 8】【PCM篇】分离双声道PCM的左右声道数据》一、修改PCM左/右声道音量以修改PCM左声道为原来的一半为例： #include <stdio.h> #include <stdlib.h> char name[]="tiankongzhicheng_44100_2ch_16bit.pcm"

c pcm转int16数组

shi_xin的专栏

07-09

617

有时候需要把pcm数据转成int16做一些定性分析； #include <stdint.h> #include <stdio.h> #include <stdlib.h> int main() { FILE *fin; FILE *fout; int16_t *tmp = (int16_t *)malloc(sizeof(int16_t)); fin = fopen("record_fpga.raw", "rb"); if (fin == NUL

MATLAB中双声道音频信号的PCM编码实战

weixin_35509395的博客

09-03

1441

本文还有配套的精品资源，点击获取简介：音频信号编码是数字音频处理的核心，PCM编码是一种重要的编码方式。本文将详细介绍如何使用MATLAB进行双声道音频信号的PCM编码，包括信道分离、非均匀量化以及十进制到二进制的转换。文章将通过实际的MATLAB代码，帮助读者理解PCM编码的具体实现，并掌握数字音频处理的基础。 1. 音频信号基本概念音频信号是通过空气...

WangDeLiangReview2018 - (6)多通道/阵列分离

FonFon27的博客

02-27

948

【WangDeLiangOverview2018】 Supervised Speech Separation Based on Deep Learning: An Overview DeLiang Wang / Jitong Chen @ Ohio IEEE/ACM Trans.ASLP2018 【目录】 1. 引入 2. 学习机器(learning machines) 3. 训练目标(training target) 4. 特征 5. 单声道分离 5.1 语音增强(sp...

左右声道音频数据混音

03-01

<think>好的，用户现在想了解左右声道音频数据混音。首先，我需要回忆之前的对话历史。之前他问过关于C语言文件写入音频数据的代码，现在转向音频处理中的混音部分。这说明他可能在做音频相关的开发，比如录音、处理或播放。用户的问题比较直接，就是左右声道的混音。我需要先解释混音的基本概念，然后给出具体的实现方法。混音通常有两种情况：立体声到单声道的合并，或者两个声道的混合处理。可能用户需要将立体声转为单声道，或者调整左右声道的平衡。接下来要考虑技术细节。比如，音频数据的格式，通常是PCM，分8位、16位、32位等。处理时需要注意数据类型，避免溢出。对于每个样本，取左右声道的平均值是最常见的方法，但也要提到其他方法，比如加权平均或者动态范围控制。用户可能对代码示例感兴趣，所以需要用C语言或类似伪代码展示如何操作。同时，需要注意内存对齐、字节序（大端小端）的问题，这些在实际开发中容易出错。还要提到可能的问题，比如溢出处理，如何避免削波，比如使用饱和加法或归一化。另外，用户之前的代码中有文件操作，可能他在处理原始PCM数据的录制或处理，所以混音后的数据可能需要写入文件，这部分可以联系起来，比如混音后再调用之前的写入逻辑。潜在的问题还有性能优化，比如使用SIMD指令加速处理，或者多线程处理。不过根据用户当前的知识水平，可能暂时不需要深入这些高级话题，但可以简要提及。最后需要总结应用场景，比如语音处理、降噪、节省存储空间等，帮助用户理解为什么要进行混音操作。同时，注意事项部分要强调测试和验证的重要性，确保混音后的音质符合预期。总结下来，回答的结构应该是：基本概念、实现方法、代码示例、注意事项、应用场景。这样用户能逐步理解混音的过程，并且有实际的代码参考，同时了解可能遇到的坑和解决方法。</think>以下是对左右声道音频数据混音的详细介绍： --- ### 一、基本概念 **声道混音**的本质是将两个独立声道的音频数据合并为一个新的音频信号。常见场景： 1. 立体声转单声道（$Stereo \rightarrow Mono$） 2. 平衡左右声道音量 3. 多音轨混合（如卡拉OK消除人声） --- ### 二、实现方法 #### 方法1：简单平均法（最常用） $$ \text{MixedSample} = \frac{L + R}{2} $$ ```c // 以16位有符号PCM为例 int16_t* mix_stereo_to_mono(int16_t* left, int16_t* right, int sample_count) { int16_t* mono = malloc(sample_count * sizeof(int16_t)); for (int i = 0; i < sample_count; i++) { int32_t sum = (int32_t)left[i] + (int32_t)right[i]; mono[i] = (int16_t)(sum / 2); // 防止溢出 } return mono; } ``` #### 方法2：加权混合 $$ \text{MixedSample} = \alpha L + (1-\alpha)R $$ 其中$\alpha \in [0,1]$控制声道平衡（$\alpha=0.5$时为平均） --- ### 三、关键注意事项 1. **数据类型处理**： - 8位PCM：无符号（0-255） - 16/32位PCM：有符号（-32768~32767） - 浮点型：范围通常为$[-1.0, 1.0]$ 2. **溢出防护**： ```c // 饱和处理示例 int32_t sum = left[i] + right[i]; sum = (sum > 32767) ? 32767 : (sum < -32768) ? -32768 : sum; ``` 3. **内存对齐**： - 立体声数据通常交替存储：$L_0, R_0, L_1, R_1,...$ - 分离声道示例： ```c void split_channels(int16_t* stereo, int16_t** left, int16_t** right, int samples) { *left = malloc(samples * sizeof(int16_t)); *right = malloc(samples * sizeof(int16_t)); for (int i = 0; i < samples; i++) { (*left)[i] = stereo[2*i]; (*right)[i] = stereo[2*i + 1]; } } ``` --- ### 四、高级技巧 1. **归一化处理**： $$ \text{MixedSample} = \frac{L + R}{\sqrt{2}} $$ （保持能量恒定，避免削波） 2. **SIMD优化**： ```cpp // 使用SSE指令集加速（处理4个样本/周期） __m128i left = _mm_load_si128((__m128i*)left_data); __m128i right = _mm_load_si128((__m128i*)right_data); __m128i avg = _mm_avg_epi16(left, right); ``` 3. **动态范围控制**： ```c // 压缩动态范围（伪代码） float threshold = 0.9f; float mixed = (left + right) / 2.0f; mixed = mixed > threshold ? threshold : (mixed < -threshold ? -threshold : mixed); ``` --- ### 五、应用场景 1. **语音处理**：电话会议中将立体声转为单声道 2. **降噪**：通过相位抵消消除特定声道噪声 3. **数据压缩**：单声道数据体积减少50% --- ### 六、验证建议 1. 使用Audacity等工具对比原始/混合后的波形 2. 检查最大采样值是否超出数据类型范围 3. 通过FFT分析频域特性是否改变