Phonemizer | Python文本语音(音素)表征包

音素

音素是构成语音的基本声音,音节和单词建立在音节上。在与 语音 和 语言 处理相关的各种应用(例如 文本到语音系统 )中,将文本从其拼写形式转录为语音字母表是一项重要要求。

Phonemizer 是一个精确寻址的 Python 包, 它将文本从其拼写表示转录为语音表示。该包设计用户友好的,并公开了一个高级音素化函数, 支持大约100种不同的语言。phonemizer 使用的默认后端是 eSpeak (Dunn & Vitolins,2019 年),一种基于语言专业知识和手写转录规则的文本转语音软件。它将文本转录成国际音标,并支持一百多种语言。使用 MBROLA 声音(Tits & Vitolins,2019),eSpeak 后端可用于大约 35 种语言,以 SAMPA 计算机可读语音字母表转录文本。

安装

安装phonemizer前需要配置espeak,

  • winhttps://github.com/espeak-ng/espeak-ng/releases下载对应的msi文件点击安装

  • mac首先配置好homebrew,之后命令行brew install espeak

pip3 install phonemizer

英文音素化

from phonemizer import phonemize

phonemize(text, language='en-us', prepend_text=False, preserve_punctuation=False, with_stress=False, njobs=1)

  • text 文本列表

  • language 语言。"en-us"美国英语, "zh"中文

  • prepend_text 输出结果保留输入的文本,默认False

  • preserve_punctuation 输出结果保留标点符号,默认False

  • with_stress 标记重读,默认False

  • njobs 并行运算核数&#x

  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值