python处理语音的包_使用Python 2.x/3.x库处理语音数据

Python部落(python.freelycode.com)组织翻译,禁止转载,欢迎转发

我来宣传一下自己开发的用来处理语音数据的库。

PraatIO提供了读写praat格式文件的工具,它是一种跨平台的应用,主要为学术社区提供了可视化,抄录,编辑以及提取语音信息的功能。

这个库的主要功能在于读写转录,可用于提取语音数据的信息。这个库即可以与praat结合使用也可以脱离其使用。

https://github.com/timmahrt/praatIO

ProMo——Prosody Morph的简称——是一个可以对持续性或高音文件进行复杂处理的库。人们可以扩展不同的单词,比如说改变一个语句的单调。

https://github.com/timmahrt/ProMo

Pysle是python中针对Isle字典的一个接口——该字典是包含了英文中重音信息的发音字典。通过使用pysle,人们可以自动地标记出转录演讲中的重音。有一个函数可以使用PraatIO根据重音信息标记出textgrid。

https://github.com/timmahrt/pysle

PyAcousitics是我目前工作相关的内容。PraatIO和ProMo都是从pyAcoustics中分离出来的。它虽然有些杂乱,但是包含了许多有用的工具。当你需要从语音数据中提取或者修改信息时你会发现它很有用。

https://github.com/timmahrt/pyAcoustics

[备注:我忘记了pysle,现在把它加到列表中。

备注2:每一个库都包含了演示代码来展示相关的功能,另外在核心功能上也在文档中添加了readme文件。Windows中的二进制安装文件目前也可以使用了。ProMo中的readme文件也包含了图像示意图。

备注3:修改格式,抱歉,我对reddit还不太熟悉。

备注4:可参见 /r/Linguistics:https://www.reddit.com/r/linguistics/comments/4fsa0s/python_2x3x_libraries_for_working_with_speech/]

英文原文:https://www.reddit.com/r/Python/comments/4fmmt1/python_2x3x_libraries_for_working_with_speech_data/

译者:dlgao

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值