Praat脚本-013 | 无需标注自动切除音频首尾静音段

最新推荐文章于 2024-05-15 16:38:46 发布

极地语音工作室

最新推荐文章于 2024-05-15 16:38:46 发布

阅读量1.8k

点赞数 4

分类专栏： Praat 文章标签： praat脚本自动切分静音段批量处理音频

本文链接：https://blog.csdn.net/shaopengfei/article/details/112252779

版权

Praat 专栏收录该内容

54 篇文章 113 订阅

订阅专栏

引题

在录音完成或者从别处得到一批音频之后，在对音频进行标注之间，除了以前提到的需要查看噪声情况，查看音量大小，另外一个问题就是需要查看每一句话，首尾的静音段是否过长？比如以下的句子，它的首尾静音段时长达到了1-2秒。
在这里插入图片描述
这样就造成一个困扰，在标注的时候每次听音都要浪费这多余的几秒种，在讲究效率的今天，这显然是比较浪费时间的。在其它编程语言中如Python，它是有专门的包处理音频的，是可以截取首尾静音段的。使用Praat脚本也可以达到这个目的，因为Praat也有一个功能是自动检测到静音段的。尤其是录音条件良好，在首和尾的静音段。

操作方法

首先介绍一下这个操作，读进来一个wav之后，点击右侧的Annotate，再点击To TextGrid(silence)...
在这里插入图片描述
这时候会弹出一个对话框，这里面的设置可以默认不动。有兴趣的可以自行调整，会影响到得到的静音段边界的位置，以及容错率等。

这时候我们得到一个TextGrid

和音频同时打开之后是这样的，由于这句话的底噪很小，所以它的对静音段的判断还是非常准确的。至于中间也判断出来静音段，这个是没有办法避免的。而我们最需要的其实是第一个，和最后一个静音段。利用这两个静音段，我们可以自由决定保留多长的时长。
在这里插入图片描述
将以上的一系列操作写成脚本就可以了。

运行脚本

本文的代码下载地址见下文(获取脚本部分)是13-cut_silence/Cut_Wav_TextGrid.Praat。脚本里有我的邮箱，有任何问题都可以来信咨询。

打开Praat之后，选择Praat，Open Praat Script...，打开这个脚本，然后在脚本窗口选择Run，Run，或者直接使用快捷键Ctrl+R，在弹出来的对话框里，设置以下几个地方：

设置你的wav所在的目录，这里因为是在Windows系统，所以路径斜线是\，如果你是在Mac使用，将这个斜线方向反一下就好；
同样的方法设置保存wav所在的目录；
设置你需要对这个wav保存的时长，这里是对首尾，保留0.1秒，注意如果你首尾的时候不足0.1秒，脚本是不会对音频进行切分的；

设置完毕，点击OK，运行脚本，我们来对比一下切分前后的wav，下图上半部分是切分之前的，下图就是利用上面的脚本自动切分之后的，可以看到首尾，被保留了0.1秒的静音段时长，如果你想保留0，那么就设置0就可以了。
在这里插入图片描述

获取脚本

https://github.com/feelins/Praat_Scripts

本站所有Praat脚本都可以在上述github的项目目录里找到，如果日常对代码、脚本操作比较熟练的可通过下载、安装、配置github for windows在自己的电脑上通过git clone将代码下载到本机，这样的好处是可以跟主站及时更新代码。
不想费如此脑筋，可以通过点击如下图Code位置所示，下载整站的代码，可直接使用。
在这里插入图片描述