pajek软件使用方法_使用音频分析软件帮助声音女性化训练的方法介绍

最新推荐文章于 2021-03-17 17:04:43 发布

weixin_39664136

最新推荐文章于 2021-03-17 17:04:43 发布

阅读量2.4k

点赞数

文章标签： pajek软件使用方法怎么样采集声音的波形和频率

首先要给出的一个忠告是，对于希望获得女性声音并用来在日常生活中使用的MtF，即便因为时间或者经济条件等等现实原因不能到专业的机构接受指导，至少也一定要参考专业的声音训练指导手册和针对MtF声音女性化的指导视频，而不是中文网络上流传更广泛的“伪声”教程——你要明白这两者之间的区别，后者的目的是一种娱乐性质的技巧，它偏向于教会你如何发出一种（有时候是过于夸张的）声音，而更少关心你如何长期和稳定地使用它。

值得感谢的是，中文网络中有越来越多的人在尝试翻译声音女性化的指导手册，在知乎上就可以搜索得到。至于指导的视频，似乎还很匮乏，但对于稍微有些英语基础的同学来说，在油管自动字幕的帮助下观看voice feminization的视频也并不是一件特别困难的事。

好了，接下来我们进入正题，我们要使用Praat这款音频分析软件来帮助我们分析自己的声音。Praat是一款开源的语音学软件，它可以采集和分析声音信号，并输出诸如频谱、音高、音强、共振峰等等很多种图表。而我们使用这款软件的目的就是利用这些图表对我们的声音进行分析，或者把自己的声音图表与其他声音图表进行比对。

你可以在这里找到适用于你使用平台的Praat的下载链接：http://www.fon.hum.uva.nl/praat/

打开Praat后，我们可以看到一个控制界面，看起来有些复杂，但别着急，我们只需要使用其中很少的一部分功能。我们需要做的是创建一个新的录音，点击New→Record mono Sound

左边的两个选项分别是单声道和双声道，在这里我们选择单声道就可以，右边是采样频率，通常我们选择44100Hz就行。然后点击Record开始录音，点击Stop停止。录音结束后，选择右下角的Save to list

接下来我们看到界面左边的列表里有了你刚才录制的声音，选中它然后点击右边的View&Edit

现在我们就看到了一个有波形图像的界面。首先我们需要设置好希望显示的图像，在菜单栏中依次打开Spectrum（频谱）、Pitch（音高）、Formant（共振峰）菜单，并勾选相应“show xxx”的选项。一个包含了频谱、音高和共振峰的图像就会出现在波形图下面的方框中（如果录音过长，会出现如下图一样无法显示的情况，这时候使用下面讲到的框选放大方法就可以显示）。窗口左下角有一排按钮，以all和sel（select）为例，all是指显示录音全部范围，sel则是显示你在波形图中拖动鼠标框选出的范围。

上面这段录音是我用男性声音和女性化声音分别录制的かきくけこ（ka、ki、ku、ke、ko）五个假名发音，可以看到左边和右边各有五个明显的人声的声音波形，我们首先框选左边男性声音的五个波形，sel放大，就得到了下面的图像，其中下方方框里的图像就是上面所说包含了频谱、音高和共振峰的图像。下面我们依次讲解各个图像的意义：

有明暗区别的灰色波纹背景是频谱图，它的横轴是时间，纵轴是从0到5000各个频率上声音的强度。人说话时发出的声音是复合的，包含多个频率，可以说正是不同频率的声音不同的叠加方式，才产生了听觉上的区别。正如图上看到的，不同的发音（ka、ki、ku、ke、ko）的频谱是有区别的。

蓝线是分析得出的音高曲线，它的横轴是时间，纵轴则是右边蓝色字体显示的0到500Hz范围的频率值。音高是经过复合叠加后声音的平均振动频率，我们练习女性化声音时最经常提到的就是这个频率，很多人说我们需要把音高提到200Hz以上才能听起来接近女性声音，但也并不绝对。正如你在图上看到的，音高只是声音的平均频率，你的声音不只有音高一个属性，更重要的是你振动的方式——也就是你的频谱分布的改变。

红点是共振峰的分布。你会发现它和频谱图上深色的部分有很大的重叠。而它的意义就在于此。一个复合声音是由多个频率上单个声音叠加而成，而把单个声音振动频率的峰值点选取出来在连续的时间上表示，就是共振峰的分布。我们甚至可以说，共振峰才是决定音色的最重要的因素。我们可以观察ka音和ki音的区别，ka音在2000Hz上下各有一个共振峰，而ki音的共振峰则集中在2000Hz以上，这是因为a这个元音发音时，口腔伸展张开，共振的空间增大，声波在口腔中反射的路径较长，于是频率就较低，而i这个元音发音时口腔压缩扁平，共振空间小，频率就较高。

以上就是分析频谱、音高和共振峰的简单背景知识，下面我们再截取完整录音后半段的女性化声音，和上图进行比较。

首先我们看蓝线也就是音高，右边软件自动分析出的平均音高是248Hz，而我们观察蓝线的位置也能看出，比男性声音的位置提高了很多。但正如上面说的，音高只是声音女性化的一个小方面，所以我们还要观察频谱和共振峰的区别。还是以ka音为例，我们看到，使用女性化声音技巧后，大约4000Hz一下的数个声音都发生了不同程度的频率提升，接近0Hz的那条提升最少，但深色部分已经离开图像的下沿（对比男性声音），而越是接近5000Hz，频率提升就越明显。其他几个音也有类似的表现。

也就是说，声音女性化的一个典型标志，就是复合声音的整个频谱曲线中，不同声音发生不同程度的上移。但是接下来的问题就是，每个声音达到什么样的频率范围，复合后的声音才是一个听起来接近女性的声音呢？一个最简单的办法就是：和一个“标准”的或者你理想中的女性声音作对比。比如如果你有条件，完全可以邀请一名你觉得声音很好的顺性别女性录下一些字、词、句子的声音，然后你也录制同样的字、词、句子，把两个声音的图像——尤其是频谱和共振峰做对比，对于有明显差别的字、词，再通过改变音高、共鸣位置、口型等等方法反复练习，直到获得一个比较接近的对比图像。

下面我就举一个简单的例子，由于我身边找不到可以录制音频的女性，我暂时先选取从百度翻译中截取的女性声音来代替。我截取了百度翻译的ka音，和自己录制的ka音作比较，如下图所示，左边是我的发音，右边是百度翻译的发音。

可以看到，这里有四条（后半段“a”音的余音则中有五条）明显的共振峰，分别位于大约数百Hz、一千多Hz、三千多Hz和顶端接近5000Hz处，而“k”的爆破音后“a”发音开始时，又出现一条大约1-200Hz的低频共振峰。比较各共振峰的位置，都接近百度翻译女声的共振峰位置，那这个发音就是一个接近女性声音的发音。

作为对比，我也录制了一个从男性声音出发单纯提高音高，但并不改变共鸣位置的ka音图像。可以看到这个图像中，虽然音高达到了232Hz，接近0Hz的两个共振峰也都提升到了接近右侧图像的水平，但是图像中间的一条共振峰位置比右侧对应的低很多，而且缺少了一条大约在一千多Hz的共振峰。所以这些声音复合在一起后，听起来仍然更像是一个“捏着嗓子说话的男性”而不是女性。

以上就是对使用该软件帮助声音女性化训练的一点背景知识和方法的介绍，但这并不是全部的方法，我也不是专业的语音学人士，只是基于一些最基本的理工类常识表达我对声音图像的理解，但我相信只要你在使用它的过程中多加思考和归纳，你会找到比我介绍的更详细、更科学的分析方法。

需要特别指出的是，这个软件并不能帮助你学习关于训练方法的知识，比如说如何提升喉部、如何改变共振位置、如何提高声门开放和闭合时的声音频率（open/close quotient or OQ/CQ）等等问题，你仍然需要通过阅读声音女性化的指导手册或者教学视频来学习。这个软件的意义在于，当你掌握了以上练习的技巧后，你可以通过使用这个软件来对你的声音进行比较和分析，更好判断出你需要改进的问题。你可以把它当做一面可以看到你自己声音的镜子，而不是一个可以用来改变你容貌的化妆盒。

衷心祝愿每个人都能找到理想中的声音。

weixin_39664136

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pajek软件使用方法_使用音频分析软件帮助声音女性化训练的方法介绍

首先要给出的一个忠告是，对于希望获得女性声音并用来在日常生活中使用的MtF，即便因为时间或者经济条件等等现实原因不能到专业的机构接受指导，至少也一定要参考专业的声音训练指导手册和针对MtF声音女性化的指导视频，而不是中文网络上流传更广泛的“伪声”教程——你要明白这两者之间的区别，后者的目的是一种娱乐性质的技巧，它偏向于教会你如何发出一种（有时候是过于夸张的）声音，而更少关心你如何长期和稳定地使用它...
复制链接

扫一扫