最近,项目里给出了一个小需求,根据excel表格里的姓名,获取全拼。例如,张三转成zhangsan。手动添加肯定是不行的,我发音不准,en和eng有时分不清。所以就到python里面找了相关的库,pypinyin确实是可以的。
1、安装
在cmd窗口里执行
python -m pip install pypinyin
2、代码
from pypinyin import lazy_pinyin, Style
# pypinyin有很多方法,lazy_pinyin属于常用的
# Style有很多不同的属性,根据不同的属性可以返回不同的类型的结果
# 甚至可以带声调
# 返回的一个列表
>>> lazy_pinyin('张三', Style.NORMAL)
['zhang', 'san']
# join方法可以做拼接
# 应用到pandas中就可以对数据做批量处理了
>>> ''.join(lazy_pinyin('张三', Style.NORMAL))
'zhangsan'
# df['account']=df['姓名'].apply(lambda x : ''.join(lazy_pinyin(x, style=Style.NORMAL)))
哈哈,以上就是python小工具今天的介绍,有兴趣欢迎关注python小工具,一起学习python和pandas