SPPAS自动对齐软件的介绍安装和使用

最新推荐文章于 2022-06-29 00:21:34 发布

JamesJuZhang

最新推荐文章于 2022-06-29 00:21:34 发布

阅读量6.4k

点赞数

分类专栏： Speech Recognition 文章标签： SPPAS 强制对齐

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jojozhangju/article/details/18811531

版权

Speech Recognition 专栏收录该内容

29 篇文章 13 订阅

订阅专栏

最近一直在自主学习连续语音识别的相关知识，也着手开始动手自己做一些列的实验。实验过程中需要采集自己需要的语料数据，但是发现采集之后标注确实是个问题，单纯使用praat逐个词的将音素也标注出来，实在是费时费力，所以经过这几天与同学的讨论和搜集资料，找到一个叫SPPAS的自动对齐标注软件，通过实验，基本满足我的需求，下面给大家介绍一下。

SPPAS介绍：

这个软件是法国人搞的，所以毋庸置疑，对于法语的标注效果最好。当然软件同样支持英文，中文等十种语言。软件中会有每种语言所训练好的语法字典以及声学模型，我只是测试了中文和英文的标注，效果挺不错的，基本能够保证一般的需求，也就是将文本标注成词级别和音素级别。

SPPAS下载：

官方的下载网址是：http://aune.lpl.univ-aix.fr/~bigi/sppas/download.php

SPPAS安装：

在安装SPPAS之前，需要先事先安装好以下的部分：

Python
wxPython
sox
Julius

具体的安装步骤和方法，官方的网址会有详细的指导：http://aune.lpl.univ-aix.fr/~bigi/sppas/installation.php

注：这里需要注意的一点是SPPAS的安装路径要在英文目录下，一开始我安装忽略了这一点，安装之后使用不了，总是报错误，后来才发现，安装的路径中有中文。

SPPAS使用：

安装好之后我们打开就能看到初始化的界面：

下面我们就可从尝试标注了：

例：

我们对wav文件进行标注，我们需要wav文件以及所对应的同名的txt文件，txt中的内容与wav内容对应。如：000.wav中的内容为“zero”，我们要在000.txt文件中写入“zero”，值得注意的是如果是一句话的话，里面涉及的停顿部分我们使用#来隔开，以帮助其找到分界点。

准备工作搞定之后我们添加文件：

然后在右面根据我们的需要选择：

注：最下两个选项貌似只支持法语和意大利语，不使用的时候不要选择。

然后选中wav，点击右面最下面的开始标注：

搞定之后会出现相应的日志：

然后我们查看文件夹下：

这是标注好的结果，一般merge.TextGrid就是我们需要的部分，我们可以使用praat来进行查看：

以上就是SPPAS自动对齐软件的介绍安装和使用。

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。