python查单词音标_从Python NLTK或其他模块中的任何单词获取音素?

本文探讨了使用Python的NLTK库从cmudict获取单词音标的问题,当遇到未识别的单词时,提出了通过递归分割未知单词的解决方案,以找到可能的音标组合。
摘要由CSDN通过智能技术生成

Python NLTK has cmudict that spits out phonemes of recognized words. For example 'see' -> [u'S', u'IY1'], but for words that are not recognized it gives an error. For example 'seasee' -> error.

import nltk

arpabet = nltk.corpus.cmudict.dict()

for word in ('s', 'see', 'sea', 'compute', 'comput', 'seesea'):

try:

print arpabet[word][0]

except Exception as e:

print e

#Output

[u'EH1', u'S']

[u'S', u'IY1']

[u'S', u'IY1']

[u'K', u'AH0', u'M', u'P', u'Y', u'UW1', u'T']

'comput'

'seesea'

Is any there any module that doesn't have that limitation but able to find/guess phone

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值