python第三方库:pypinyin将汉字转为拼音

汉字的拼音虽然有一定的规律,但是做一套好的汉字转拼音的系统并不是那么容易,需要考虑的问题也比较多。汉字转拼音在多个的方向上也经常使用到。比如在url中,很少使用中文作为url连接,一种方式是转换为拼音进行显示。pypinyin 是在所有的汉字转拼音中做的不错的一款,把汉字常见的一些情况都能考虑到。

安装

源码在github中

https://github.com/mozillazg/python-pinyin

安装方法:

pip install pypinyin
使用例子

直接把汉字转为拼音,这是最经常使用的一种方式:

>>> from pypinyin import pinyin, lazy_pinyin, Style
>>> lazy_pinyin(u'厦门')
[u'xia', u'men']
>>> '-'.join(lazy_pinyin(u'厦门'))
u'xia-men'
>>>

带音标的转换方式:

>>> pinyin(u'厦门')
[[u'xi\xe0'], [u'm\xe9n']]

多音词的转换:

>>> pinyin(u'厦', heteronym=True)
[[u'sh\xe0', u'xi\xe0']]

>>> pinyin(u'中心', heteronym=True)
[[u'zh\u014dng', u'zh\xf2ng'], [u'x\u012bn']]

在这里有两种发音,一个是一声的,一个是4声的。这种词很少,我测试了几个多音词,并不能全部都有记录。

如果有一个新字,也可以使用自定义自己的拼音库。使用load_phrases_dict 定义自己的拼音库。

load_phrases_dict({'步履蹒跚': [['bù'], ['lǚ'], ['pán'], ['shān']]})
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

go2coding

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值