ffmpeg进行多通道语音分离

最新推荐文章于 2024-06-19 18:19:11 发布

panxin801

最新推荐文章于 2024-06-19 18:19:11 发布

阅读量3.6k

点赞数 9

分类专栏：语音识别处理文章标签： ffmpeg 语音识别

本文链接：https://blog.csdn.net/panxin801/article/details/106327971

版权

语音识别处理专栏收录该内容

10 篇文章 0 订阅

订阅专栏

ffmpeg进行多通道语音分离

Author: Xin Pan

Date: 2020.05.22

问题

当我们想将一条多通道的语音分离成很多的单通道语音时我们怎么办呢？

解决

假设我已经有了一个多通道的音频文件DTM1_100.wav和一个手机文件phone_left.wav。

文件夹

使用下边的命令来看看文件信息：

ffprobe .\DTM1_100.wav

可以看到返回如下结果：

ffprobe version N-93397-gf8075b2c91 Copyright (c) 2007-2019 the FFmpeg developers
  built with gcc 8.2.1 (GCC) 20190212
  #此处省略很多行
Input #0, wav, from '.\DTM1_100.wav':
  Duration: 00:00:06.31, bitrate: 24576 kb/s
    Stream #0:0: Audio: pcm_s32le ([1][0][0][0] / 0x0001), 48000 Hz, 16 channels, s32, 24576 kb/s

可以看到这个音频48k的采样率、16通道的阵列数据。

使用cooledit打开这个文件我们可以看到音频的时域图，左侧可以看到16通道的拆分:

16通道打开示例

使用如下的程序，可以将阵列的数据进行拆分：

import os
import sys
import platform

# config-start
Channels = 16  # use $Channels mic array datas.
# config-end


def dirlist(path,savePath):
    for i in range(Channels):
        saveName = "out_%02d.wav" % (i)
        currentSavePath = os.path.join(savePath, saveName)
        os.system("ffmpeg -i %s -acodec pcm_s16le -ac 1 -ar 16000 -map_channel 0.0.%d %s -y" %
                  (path, i, currentSavePath))


# srciptPath = sys.argv[0]
srciptPath = r"C:\Users\abc\Desktop\array_test\DTM1_100.wav"
savePath = r"C:\Users\abc\Desktop\array_test"


dirlist(srciptPath, savePath)
print("Done!")

这里使用的是ffmpeg -i $INPUT_NAME -map_channel 0.0.$N $OUT_NAME

$INPUT_NAME是输入的名字，-map_channel 0.0.$N可以将输入文件的$N通道输出到$OUT_NAME文件中。在这个示例中$N=[0,15]。至此问题应该就解决了。

panxin801

关注

9
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
ffmpeg进行多通道语音分离

ffmpeg进行多通道语音分离Author: Xin PanDate: 2020.05.22问题当我们想将一条多通道的语音分离成很多的单通道语音时我们怎么办呢？解决假设我已经有了一个多通道的音频文件DTM1_100.wav和一个手机文件phone_left.wav。使用下边的命令来看看文件信息：ffprobe .\DTM1_100.wav可以看到返回如下结果：ffprobe version N-93397-gf8075b2c91 Copyright (c) 2007-2019 the
复制链接

扫一扫

专栏目录