Montreal Forced Aligner (MFA)安装教程及异常处理

官方地址:https://montreal-forced-aligner.readthedocs.io/en/latest/index.html

文末附常见问题解决方法:

1、FileNotFoundError: [Errno 2] No such file or directory: ‘xxx/MFA/LJSpeech_raw/corpus_data/split1/feats.0.scp’
2、kaldi包不匹配,大致描述是 mfa thirdparty kaldi


1、MFA简介

Forced alignment is a technique to take an orthographic transcription of an audio file and generate a time-aligned version using a pronunciation dictionary to look up phones for words.

Montreal Forced Aligner (MFA),一种强制对齐工具,用来生成音频 音素时长的工具

2、安装

具体请参考:

MFA installation

需要安装conda/miniconda,视系统版本还需要安装kaldi。

这里以Ubuntu 18.04为例(其它的OS会有些许不同,参考上面的网页),介绍大致的步骤:

(1)安装Anaconda或者Miniconda

Miniconda

(2)切换环境

conda create -n aligner -c conda-forge openblas python=3.8 openfst pynini ngram baumwelch

完成之后确保你在新的环境

conda activate aligner

(3)安装MFA

pip install montreal-forced-aligner

前面都比较正常,没有遇到异常

(4)安装第三方包

mfa thirdparty download

这一步出现了报错:报错是网络 connect 问题,显示 raw.githubusercontent.com 访问不上,一致进入本地,然后自己添加 hosts 进行了重定向进行了解决, 此包比较大,所以需要一些时间进行下载

(5)安装sox(可选)

安装方法请自行搜索。

其实安装sox主要是为了能align除.wav格式之外的文件,如果你不需要的话则可以省略这一步。

(6)升级到最新版

首先确保你在新的环境(aligner),然后执行:

pip install montreal-forced-aligner -U

出现

-- Requirement already satisfied:xxx --

这里一般可以跳过(
到这里就大致结束了,如果你的系统版本较低,需要安装kaldi,参考:

Kaldi github

安装结束之后执行:

mfa thirdparty kaldi /path/to/kaldi/repo

最后执行:

mfa thirdparty validate

来验证安装是否成功。
正常会显示:
All required kaldi binaries were found!

所有步骤结束之后执行:

mfa version

可以看到目前的版本。

如,显示
2.0.0a24

OK,安装成功。(不过可能还是会出现库的兼容问题,如下文的两种常见问题)

部分参考:
https://zhuanlan.zhihu.com/p/386884727


安装中常见问题:

1、FileNotFoundError: [Errno 2] No such file or directory: 'xxx/MFA/LJSpeech_raw/corpus_data/split1/feats.0.scp’

sudo apt-get install libatlas3-base
and
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$HOME/anaconda3/envs/aligner/lib/
注意,上面的需要改成自己的虚拟环境路径 $HOME/anaconda3/envs/aligner/lib/,通过 which mfa 查看,然后进行替换,例如 /opt/anaconda3/envs/aligner/lib
如果需要永久写入,修改bash: vi ~/.bashrc
添加行 export xxxx
参考:https://github.com/MontrealCorpusTools/Montreal-Forced-Aligner/issues/217

2、kaldi包不匹配
大致描述是 mfa thirdparty kaldi

这种情况下就需要进行重新编译,安装,然后重定向:
参考(https://githubmemory.com/repo/MontrealCorpusTools/Montreal-Forced-Aligner/issues/311)

根据官网的 INSTALL,主要分为两步:https://github.com/kaldi-asr/kaldi

①进入 tools 指导安装
在这里插入图片描述
过程中可能会遇到 下载中断问题,建议直接手动下载然后上传到当前目录(即 tools) 里面,方便顺利编译!
② 进入src ,根据INSTALL进行
在这里插入图片描述
建议使用 -j 8 进行加速
完成时,注意记录 kaldi 新的安装路径,用于后面的重新建立新连接,正常情况下,最后完成会出现:
make[1]: Leaving directory 'xxx/xxx/xxx/kaldi/kaldi-master
上面的目录就是我们要定向的目录了,完成 kaldi 安装后:
mfa thirdparty kaldi /home/xxx/xxx/kaldi 即可

重新运行:
在这里插入图片描述
运行成功!

  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 8
    评论
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值