将汉字转为拼音,可以用于批量汉字注音、文字排序、拼音检索文字等常见场景。
现在互联网上有许多拼音转换工具,基于Python的开源模块也不少,今天给大家介绍一个功能特性最多的模块: pypinyin
,它支持以下特性:
-
1. 根据词组智能匹配最正确的拼音。
-
2. 支持多音字。
-
3. 简单的繁体支持, 注音支持。
-
4. 支持多种不同拼音/注音风格。
-
5. 命令行工具一键转化
1.准备
开始之前,你要确保Python和pip已经成功安装在电脑上。
(可选1) 如果你用Python的目的是数据分析,可以直接安装Anaconda,它内置了Python和pip.
(可选2) 此外,推荐大家用VSCode编辑器,它有许多的优点。
请选择以下任一种方式输入命令安装依赖:
1. Windows 环境 打开 Cmd (开始-运行-CMD)。
2. MacOS 环境 打开 Terminal (command+空格输入Terminal)。
3. 如果你用的是 VSCode编辑器 或 Pycharm,可以直接使用界面下方的Terminal.
pip install pypinyin
2.基本使用
最普通的拼音转化方法如下:
# Python实用宝典
from pypinyin import pinyin, lazy_pinyin, Style
pinyin('中心')
# [['zhōng'], ['xīn']]
识别多音字:
# Python实用宝典
from pypinyin import pinyin, lazy_pinyin, Style
pinyin('中心', heteronym=True) # 启用多音字模式
# [['zhōng', 'zhòng'], ['xīn']]
设置输出风格,只识别首字母:
# Python实用宝典
from pypinyin import pinyin, lazy_pinyin, Style
pinyin('中心', style=Style