python 将中文变为拼音_python 批量将中文名转换为拼音

本文介绍了Python中将中文姓名转换为拼音的三种方法:xpinyin、pypinyin和snownlp,并提供了批量操作的代码示例,帮助读者实现批量将中文名转换为拼音和拼音首字母。
摘要由CSDN通过智能技术生成

有时在处理文件时候,我们需要将中文姓名转换为拼音,或者是转换为拼音首字母,本文将介绍三种python实现的方法,最后给一个批量操作的代码案例!

一、xpinyin

开门见山,python中文字转拼音可以使用xpinyin,直接使用pip安装即可?

pip install xpinyin -i http://pypi.douban.com/simple --trusted-host pypi.douban.com

接着导入xpinyin下的 pinyin 方法如下

from xpinyin import pinyin

首先试试中文名转拼音,

p = pinyin()

result1 = p.get_pinyin('叶伏天')

result1

结果如下:

'ye-fu-tian'

tone_marks可以显示声调

result2 = p.get_pinyin('叶伏天', tone_marks='marks')

结果如下:

'yè-fú-tiān'

去掉空格?

s = result1.split('-')

result3 = s[0].capitalize() + ' ' + ''.join(s[1:]).capitalize()

result3

结果如下:

'ye futian'

b9c933b587cd0e692232c28153846421.png

有时需要中文名转拼音首字母,也很简单?

33a48373e0fb4b77f2c5ce4210a43e3c.png

二、pypinyin

另一种方法是使用pypinyin,安装同样可以使用pip

# 安装

pip install pypinyin -i http://pypi.douban.com/simple --trusted-host pypi.douban.com

直接导入就行?

import pypinyin

再来看看中文名转拼音的实现办法

result1 = pypinyin.pinyin('叶庭云', style=pypinyin.normal)

result1

结果如下:

[['ye'], ['ting'], ['yun']]

启用多音节来实现声调

result2 = pypinyin.pinyin('叶庭云', heteronym=true)

result2

结果如下:

[['yè', 'xié'], ['tíng'], ['yún']]

因为返回的是一个嵌套的list,所以需要简单调整一下

result_ = [i[0] for i in result1]

result3 = result_[0].capitalize() + ' ' + ''.join(result_[1:]).capitalize()

result3

结果如下:

'ye tingyun'

启用多音字模式时,竟然发现 ‘叶' 也是多音字,查询了资料发现确实是这样,涨知识啦!

7e5aaf51675168939c77eb4e8047368e.png

4499d3d5530a3c22d55d5b0b62061048.png

下面是中文名转拼音首字母的方法

a95613d058e8a39cead93351eb374481.png

三、snownlp

最后一种办法是使用snownlp,同样的pip安装与导入如下:

# 安装

pip install snownlp -i http://pypi.douban.com/simple --trusted-host pypi.douban.com

# 导入

from snownlp import snownlp

中文名转拼音?

s = snownlp('叶庭云')

s.pinyin

结果如下:

['ye', 'ting', 'yun']

将list转为字符串

result4 = s.pinyin[0].capitalize() + ' ' + ''.join(s.pinyin[1:]).capitalize()

result4

结果如下:

'ye tingyun'

6e7f192885bcdb9538d1898f5348d7e5.png

最后是中文名转拼音首字母

b2a0ed6e1f1353bfd2aada816a517e2c.png

四、批量将中文名转换成拼音

现在,掌握了基本使用后,我们就能利用批量操作来解放双手

import pypinyin

import pandas as pd

df = pd.read_excel('学生名单_test.xls')

df.head()

先导入一份学生名单如下

342dc12f18148e0ab383f31c2ea5a8ca.png

下面是使用pypinyin批量将全部学生的中文姓名转换为拼音

pinyin_name = []

first_pinyin = []

for i in df['姓名']:

result = pypinyin.pinyin(i, style=pypinyin.normal)

result_ = [i[0] for i in result]

result2 = result_[0].capitalize() + ' ' + ''.join(result_[1:]).capitalize()

result3 = ''.join([i[0].upper() for i in result_])

print(result2, i, sep=' ')

pinyin_name.append(result2)

first_pinyin.append(result3)

df['英文名'] = pinyin_name

df['拼音首字母'] = first_pinyin

df.head()

或者是转换为拼音首字母,运行结果如下:

94c03f7098146a22123bdda4a804803c.png

以上就是python 批量将中文名转换为拼音的详细内容,更多关于python 中文名转换为拼音的资料请关注萬仟网其它相关文章!

如您对本文有疑问或者有任何想说的,请点击进行留言回复,万千网友为您解惑!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值