voxceleb2将m4a格式转换为wav

mx的老公

已于 2023-09-05 18:36:37 修改

阅读量351

点赞数

文章标签： python 语音识别音频格式工厂

于 2023-08-16 17:25:49 首次发布

本文链接：https://blog.csdn.net/weixin_58045015/article/details/132323621

版权

最近尝试新的模型中，要求Voxceleb2数据集的格式为.wav，而原文件的格式为.m4a格式，需要进行转换。其实网上是有相关的开源工程的，https://github.com/clovaai/voxceleb_trainer，但是由于这个作者的注释写的非常少，在没有人帮助的情况下我也看不太懂多少，只能自己根据https://www.robots.ox.ac.uk/~vgg/data/voxceleb/meta/train_list.txt所提供的trainlist列表自行转换。

于是，我写了如下代码：

目的文件夹的创建部分，在我做完之后就已经删除了。我是直接将原文件生成wav格式之后，改一个后缀名就放在了目录下面。

但是在我跑了一晚上之后才发现，原本数据集的音频标号方式是每个video编一个号码，而trainlist中是每一个人编一个号码。不能用简单的直接将原始的m4a文件换个后缀就直接生成，还要涉及到一个编号的问题。

于是我稍加调整，更改的代码如下：

这样就按文件顺序，按说话人生成连续编号的wav文件了。

但是在跑了一段脚本之后，我进行检查发现，我的编号和list中的编号不一致。仔细检查才发现，原来trainlist中的排序顺序是0-9-A-Z-a-z-*，而linux系统下的文件排序顺序则是0-9-Aa-Zz-*。会导致不同目录下的标号顺序是交错的。

因此不能直接按照原始的数据集文件进行直接生成，还是需要读取trainlist文件，按行生成连续编号的wav文件。

#!/bin/bash

outpath=-------         # 你自己的目录
listfile=-------/train_list.txt # 你存放的trianlist的位置

for directory in */* ; do

        [ ! -d $outpath/$video ] && mkdir -p $outpath/$directory

done

while read line ; do
wav=`echo $line | awk '{printf($2)}'`
m4a=${wav%.*}.m4a
[ -f $m4a ] && [ ! -f $outpath/$wav ] && ffmpeg -y -i $m4a -ac 1 -vn -acodec pcm_s16le -ar 16000 $outpath/$wav

[ ! -f $m4a ] && echo -e "\n\n\n\nit went wrong! can not found $m4a!\n" && exit 0
done < $listfile