Kaldi AMI数据集脚本学习2----run_prepare_shared.sh

在学习脚本文件时,重点关注哪些是调用标准函数,哪些是调用特定数据集的数据处理函数;

关注每个阶段处理的输入,输出和控制参数。不要面面俱到,试图理解每行代码。


1. 下载AMI数据集的xml标注文件包;

   从xml格式的标注文件提取得到data/local/annotations文件夹下文本格式的标注文件train.txt,eval.txt,dev.txt.

# Download of annotations, pre-processing,
local/ami_text_prep.sh data/local/downloads

2.  下载cmu dictionary;

      创建silence_phones.txt和optional_silence.txt;

      从cmudict/cmudict.0.7a.symbols提取  nonsilence_phones.txt,扔掉重音(stress);

      将silence phones 加到extra_questions.txt;

      下载wordlist.50k;

       limit the vocabulary to the predefined 50k words,从而得到文件lexicon1_raw_nosil_50k.txt;

       再增加类似laughter,noise等词汇后得到最终的lexicon.txt

       utils/validate_dict_dir.pl检查。     

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
根据引用和引用的信息,出现了一个文件不存在的错误"-bash: ./montreal-forced-aligner/bin/mfa_align: No such file or directory"。这种错误通常是因为文件路径不正确或文件确实不存在导致的。 首先,请确保你输入的文件路径是正确的。检查指定的路径是否正确,并在路径中使用正确的斜杠(/)和双引号("")来确保路径的准确性。 如果你确定文件路径是正确的,那么可能是安装的软件包不匹配导致的。根据引用的信息,可以尝试更新或重新安装kaldi包来解决这个问题。 此外,根据引用的信息,还可以尝试安装libatlas3-base软件包,并使用export命令来设置LD_LIBRARY_PATH环境变量。确保将路径替换为你自己的虚拟环境路径。如果需要永久写入,可以修改bash配置文件。 总结起来,如果你遇到了"-bash: ./montreal-forced-aligner/bin/mfa_align: No such file or directory"的错误,你可以按照以下步骤进行排查: 1. 确保文件路径是正确的,检查斜杠和双引号的使用。 2. 更新或重新安装kaldi包。 3. 安装libatlas3-base软件包,并设置LD_LIBRARY_PATH环境变量。 希望这些信息能够帮助你解决问题。如果问题仍然存在,请提供更多详细信息,以便我们能够更好地帮助你解决问题。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [Montreal Forced Aligner (MFA)安装教程及异常处理](https://blog.csdn.net/suiyueruge1314/article/details/120470198)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值