音素
音素是构成语音的基本声音,音节和单词建立在音节上。在与 语音 和 语言 处理相关的各种应用(例如 文本到语音系统 )中,将文本从其拼写形式转录为语音字母表是一项重要要求。
Phonemizer 是一个精确寻址的 Python 包, 它将文本从其拼写表示转录为语音表示。该包设计用户友好的,并公开了一个高级音素化函数, 支持大约100种不同的语言。phonemizer 使用的默认后端是 eSpeak (Dunn & Vitolins,2019 年),一种基于语言专业知识和手写转录规则的文本转语音软件。它将文本转录成国际音标,并支持一百多种语言。使用 MBROLA 声音(Tits & Vitolins,2019),eSpeak 后端可用于大约 35 种语言,以 SAMPA 计算机可读语音字母表转录文本。
安装
安装phonemizer前需要配置espeak,
-
winhttps://github.com/espeak-ng/espeak-ng/releases下载对应的msi文件点击安装
-
mac首先配置好homebrew,之后命令行brew install espeak
pip3 install phonemizer
英文音素化
from phonemizer import phonemize
phonemize(text, language='en-us', prepend_text=False, preserve_punctuation=False, with_stress=False, njobs=1)
-
text 文本列表
-
language 语言。"en-us"美国英语, "zh"中文
-
prepend_text 输出结果保留输入的文本,默认False
-
preserve_punctuation 输出结果保留标点符号,默认False
-
with_stress 标记重读,默认False
-
njobs 并行运算核数&#x