Praat脚本-030 | 谈谈自动标注这点儿事(4)

前面零零散散为大家介绍或者推荐了几种跟自动标注相关的内容,

第一篇为大家推荐了一种入门级别的“自动标注”,其实相当于协助大家把一些需要的信息增加进去。

Praat脚本-023 | 谈谈自动标注这点儿事(1)

第一,傻乎乎的自动标注,
第二,使用脚本的自动标注,
第三,使用诸如SPPAS的自动标注,
第四,较为专业的自动标注。

第二个,这其实是一个现成的小项目。
Praat脚本-026 | 谈谈自动标注这点儿事(2)

第三个,是为大家介绍了SPPAS的使用,
语音标注自动音段对齐工具SPPAS使用笔记

这里补充一下熊老师也有一个自己写的自动标注工具,叫做xSegmenter:音段自动切分与标注工具, http://paslab.phonetics.org.cn/index.php/others/ying_yong_cheng_xu_he_gong_ju/, 有兴趣的可至此网址下载并查看使用说明。

今天这一篇将自动标注小结一下,并且介绍一种比较专业的标注框架。

NameAlgorithmSupported Language(s)InterfaceCode Language(s)Notes
aeneasDTW30+CLI, LIB, WebPython, CNot based on ASR
CMU SphinxHMM (own), RNN11CLI, LIBC, Java, Python
DARLAHMM (HTK)EnglishWeb?Based on Prosodylab-Aligner or YouTube ASR
FAVE-alignHMM (HTK)EnglishCLI, (Web)Pythonacustic models from P2FA; GitHub code updated more frequently than Web
GentleHMM (Kaldi)EnglishCLI, WebPythonBased on Kaldi
JuliusHMM (own)English, JapaneseCLI, LIBC
KaldiHMM (own), DNN, RNNEnglishCLI, LIBC++CUDA support
kaldi-dnn-ali-gopHMM(Kaldi), DNN(Kaldi nnet3)EnglishCLI, LIBShell Script, C++, PythonWork with other languages given kaldi acoustic models
LaBB-CATHMM (HTK)EnglishWebJava
MAUSHMM (HTK)21CLI, WebC
Montreal Forced AlignerHMM (Kaldi)EnglishCLIPythonCan train other languages
Penn Forced Aligner (P2FA)HMM (HTK)EnglishCLI, WebPython
Prosodylab-AlignerHMM (HTK)EnglishCLIPythonCan train other languages
SailAlignHMM (HTK)English, Greek, SpanishCLIPerl
SPPASHMM (Julius)12+CLI, GUIPythonCan train other language, several plugins

AGPL: GNU Affero General Public License
Apache: Apache License
CLI: command line interface
DNN: Deep Neural Network
DTW: Dynamic Time Warping
GPL: GNU General Public License
GUI: graphical interface
HMM: Hidden Markov Model
LIB: library callable by third party software
MFCC: Mel-frequency Cepstral Coefficients
MIT: MIT License
RNN: Recurrent Neural Network
Web: Web-based graphical interface, local and/or remote

以上节选自,https://github.com/pettarin/forced-alignment-tools,有兴趣的可至这个项目页面查看详细信息,包括每个工具的链接。

以上基本上是业界一段时间内,以及当前比较流行的一些自动标注的工具或者框架,另外一种叫法也叫音素强制对齐,目的是为了让语音的音素与音频对应起来。可见大部分的仍然是基于HMM算法的,包括刚才补充的熊老师的工具也是基于HMM算法。

推荐有自动标注强需求的同学重点关注,Montreal Forced Aligner,该框架目前使用比较广泛,而且效果也比较好,虽然很多大厂已经在使用深度学习网络的算法,但是作为普通用户,小而精悍的HMM算法仍然是首选。 montreal框架有专门的官网网站,也可以在网上搜索相关的安装配置方法。

如果数据不多,又需要自动标注的,可在公众号后台发送“自动标注”咨询。

关注

关于对本站脚本的使用咨询,以及功能修改,增加等,都可以扫QQ咨询群,私信群主。

在这里插入图片描述

版权说明

1、版权归本公众号“极地语音工作室”,原名“语音处理小站”所有;

2、未经本站或者作者允许, 不得任意转载本文内容,否则将视为侵权;

3、转载或者引用本文内容请注明来源及原作者;

4、对于不遵守此声明或者其他违法使用本站内容者,本人依法保留追究权等。

  • 5
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
Praat是一种语音分析软件,可以用来提取基频,也称为声音的基本频率。基频是声音中重复性的振动速度,通常对应于声音的音高。 在Praat中提取基频的脚本可以通过以下步骤完成: 1. 从声音文件导入数据:首先,需要在Praat中打开声音文件,可以通过脚本命令`Read from file`来实现。这将把声音文件加载到Praat的对象中。 2. 创建声音分析对象:接下来,需要使用`Sound`对象来表示声音。可以使用脚本命令`Create Sound as pure tone`或`Create Sound as noise`来创建声音分析对象。 3. 设定分析参数:在分析之前,需要设置基频分析的参数。可以使用脚本命令`To Pitch`来打开基频分析对话框,并设置参数,如最小基频、最大基频等。 4. 提取基频:一旦设置好了分析参数,可以使用脚本命令`Get pitch`来提取基频。这将基于所选的参数对声音进行基频分析,并将结果保存在Praat的对象中。 5. 导出基频数据:最后,可以使用脚本命令`Write to spreadsheet file`将基频数据保存为电子表格文件,以供进一步分析或处理。 需要注意的是,以上步骤仅提供了一个基本的基频提取框架,实际使用时可能需要根据具体的需求进行参数调整和数据处理。 总结而言,利用Praat提取基频的脚本主要包括导入数据、创建声音对象、设置分析参数、提取基频和导出数据等步骤,可以根据具体需求进行调整和扩展。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

极地语音工作室

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值