Praat脚本-017 |拆分已经标注好的音素为两个音素

引题

在标注过程中,一批任务标完之后,可能对一些音素重新进行了定义,这时候可能会需要批量将一个音素拆分成两个音素,比如对于双元音,au,拆分成au,当然扩展开来,也可以拆成多个音素,本脚本只讨论拆成两个音素的情况。音素被拆分成两个,在标注文件上,边界条也要同步体现,如果有大量的数据,手工完成自然费时费力,这个脚本可以批量进行拆分。对于拆分之后的时间点,是采用的原始音素的中间值,即在原来音素的时长中间点,增加一个边界条。

如图所示,拆分后,我们想达到这样的效果。
在这里插入图片描述
在这里插入图片描述
说明:该句样例来自开源的CMU

英语数据。标注的音素体系采用的sampa体系。

运行脚本之前,需要有已经标注好的数据,要进行哪些拆分,请制作一下如下的列表文件,该文件表头是old和new,第一列是原始音素,第二列是要拆分的,以+号隔开。

old new
eI  e+I
3:r 3:+r

本文的代码下载地址见下文(获取脚本)是17-split_one_phoneme_into_two/Split_One_Phoneme_into_Two.praat。脚本里有我的邮箱,有任何问题都可以来信咨询。

打开Praat之后,选择PraatOpen Praat Script...,打开这个脚本,然后在脚本窗口选择RunRun,或者直接使用快捷键Ctrl+R,在弹出来的对话框里,设置以下几个地方,这里小编根据不同的情况分别加以说明。

脚本运行时,指定输入、输出目录,音素所在的层,以及上述列表文件的路径;
在这里插入图片描述
运行完成会在当前目录里生成一个log.txt,这里面记录了进行了拆分的音素所在的文件,位置;


cmu_us_arctic_slt_a0001.TextGrid,4,3:r->3:+r

cmu_us_arctic_slt_a0001.TextGrid,11,eI->e+I

cmu_us_arctic_slt_a0001.TextGrid,15,3:r->3:+r

cmu_us_arctic_slt_a0001.TextGrid,19,eI->e+I

cmu_us_arctic_slt_a0001.TextGrid,37,3:r->3:+r

获取脚本

https://github.com/feelins/Praat_Scripts

本站所有Praat脚本都可以在上述github的项目目录里找到,如果日常对代码、脚本操作比较熟练的可通过下载、安装、配置github for windows在自己的电脑上通过git clone将代码下载到本机,这样的好处是可以跟主站及时更新代码。
不想费如此脑筋,可以通过点击如下图Code位置所示,下载整站的代码,可直接使用。
在这里插入图片描述

关注

关于对本站脚本的使用咨询,以及功能修改,增加等,都可以扫QQ咨询群,私信群主。

在这里插入图片描述

版权说明

1、版权归本公众号“极地语音工作室”,原名“语音处理小站”所有;

2、未经本站或者作者允许, 不得任意转载本文内容,否则将视为侵权;

3、转载或者引用本文内容请注明来源及原作者;

4、对于不遵守此声明或者其他违法使用本站内容者,本人依法保留追究权等。

  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
Praat(国际音标 [praːt]或[pʀaːt])在荷兰语中是说话或交谈的意思,而doing phonetics by computer即使用计算机研究语音学。作为软件的名称,简便起见,不妨合起来翻译作Praat语音学软件。 [编辑]作者 Praat的作者是荷兰阿姆斯特丹大学人文学院语音科学研究所的主席保罗•博尔斯马(Paul Boersma)教授和大卫•威宁克(David Weenink)助教授。 [编辑]版本 Praat最早的版本发布于1993年。起初用户还无法自由地下载使用,但从2003年6月5日的4.1版起,作者取消了专门的授权并开放了绝大部分源代码。进一步,从2004年3月4日的4.2版起,作者开放了全部源代码,使Praat成为采用GNU通用公共许可证授权的开源软件。相隔短则一天,长则月余,作者就会发布最近修订的版本,消除旧的故障,增添新的功能。2007年12月10日发布了5.0版。[1] Praat目前支持在多种计算机平台上运行,包括:  Macintosh  Windows[2]  Linux,FreeBSD  SGI,Solaris,HPUX 作者为以上平台的用户提供已编译好的目标文件。高级用户还可以在其他操作系统平台上修改并编译源代码后运行Praat程序。 Praat能够在图形和命令行两种用户界面下运行,但两种界面的目标文件(可执行文件)各自独立,以Windows版为例,即分为praat.exe和praatcon.exe两个可执行文件,其中后者只能通过命令行方式从控制台调用。 [编辑]功能简介 请注意:和维基百科中其他介绍软件产品的条目一样,本条目以下章节中对Praat的功能进行的简要介绍仅供读者参考,不可能也无意于代替由开发者提供的手册文档。 [编辑]用途概述 Praat的主要功能是对自然语言的语音信号进行采集、分析和标注,并执行包括变换和滤波等在内的多种处理任务。作为分析结果的文字报表和语图,不但可以输出到个人计算机的磁盘文件中和终端的显示器上,更能够输出为精致的矢量图或位图,供写作和印刷学术论文与专著使用。 此外,Praat还可用于合成语音或声音、统计分析语言学数据、辅助语音教学测试,等等。随着新版本的发布,Praat的功能和用途仍在不断扩展,但实际上多数用户只需要用到一小部分功能。 [编辑]构成与界面 Praat程序由外围与核心两层构成。外围主要包括对象窗口(Object window,标题为Praat objects)、画板窗口(Picture window,标题为Praat picture)、脚本编辑器(ScriptEditor)、按钮编辑器(ButtonEditor)、数据编辑器(DataEditor,无固定标题)、情报窗口(Info window)和手册(Manual)等不负责具体的信号处理任务的辅助性组件。Praat每次启动时,自动打开对象窗口和画板窗口。对象窗口也是Praat的主控窗口,在Praat程序的会话进程中始终打开,大部分功能也需要由此展开。脚本(script)在是Praat中执行各种操作的宏命令,能够简化日常操作,减少出错,并实现大量复杂操作的自动化。按照作者的最初设想,除了Praat之外还会有其他程序使用与Praat相同的外围程序,但多年来一直没有实现[3]。 Praat的核心部分即具体负责语音信号处理任务的程序,包括所有的对象类型(Types of object)、动作命令(Action commands)和相应的编辑器(Editors)。对象(object)是由Praat程序所构建的数据存储载体,有很多种类型,如声音(Sound)、文本表格(TextGrid)、音高(Pitch)、变换(Manipulation),等等,通过执行编辑器或动态选单(Dynamic menu)中的动作命令完成对数据的查询(数字化测量)和处理(生成新对象)任务。声音编辑器(SoundEditor)和文本表格编辑器(TextGridEditor)是Praat中最常用的两种编辑器,多用于涉及语音分析和标注的科学研究与课堂教学。 [编辑]语音分析与标注 对语音信号的分析与标注Praat的基本功能。在Praat中录音或读取音频文件后,可以按用户要求显示以下多种语图:  三维语图(spectrogram)  频谱切片(spectral slices)  音高(即基频[4])曲线(pitch contour)  共振峰曲线(formant contour)  音强曲线(intensity contour) 所有的语图都可以绘制成精致的矢量图,也可以将相应的对象数据保存为磁盘文件。除直观的语图外,Praat也能通过对信号数据的计算获得各种文字情报,比如音高、时长、第一或第二共振峰频率的数值等,也同样可以根据需要输出为适当的形式。 Praat允许用户对语音数据进行标注,包括音段切分和文字注释,标注的结果还可以独立保存和交换。然而,Praat本身缺乏自动标注功能,只能对有声段和静默段进行简单的识别,而不能对音节、节拍群等语流单位加以切分。[5] [编辑]其他功能 Praat还具有许多其他功能,包括:  语音实验:嗓音分析、多重强迫选择实验、滤波、声源滤波合成、发音合成等。  辅助教学:前馈神经网、优选论学习等。  统计分析:主成分分析、多维量表、判别分析等

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

极地语音工作室

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值