Python-实现将excel里的中文(汉字)转对应拼音输出

1.起因:

由于很多时候中文命名的不好使用,但命名为英文的话。博主的词汇量有限,所以就不为难自己了。
我平时都是使用拼音对应中文来给测试语料命名。当我为所有测试语料都用拼音命名完后,遇到要按不同的产品挑出对应词条的语料,在几千个文件里一次挑一个太慢了。挑几百个我就想歇菜了。(哈哈哈哈。开玩笑的啦 ,只要思想不滑坡,办法总比困难多💪)

已知:一个产品的词条可能十几个或者一百多个,词条都是中文的,文件命名都是拼音命名的。
那么我可以先把中文词条列表生成一个拼音清单,再用清单里的拼音运行脚本去找啊。

2.代码如下:
from pypinyin import lazy_pinyin
import pandas as pd
    #读入EXCEL文件
ex = pd.read_excel("../test_word/test.xlsx")
result = ""
for i in range(ex.shape[0]):
    zh_word = (ex.iloc[i,0])
    test_list = lazy_pinyin(zh_word)
    #result = result + ''.join(test_list) + ' '#输出结果不换行
    result = result +''.join(test_list)+'\n'#输出结果换行
print(result)
3.例子里的中文词表如下:在这里插入图片描述
4.运行脚本后:在这里插入图片描述

是不是很快,几百个中文转拼音也不是问题了呢~

需要注意的是,我们很多汉字是多音字,例如:调,即可读diao也可读tiao。所以脚本处理完记得检查一下哟~

下篇写使用脚本在几千个文件里一次性把一个产品对应的所有词条的语料文件挑出来~
Python-实现筛选出文件夹下含有特定名字的文件

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值