python读取文本后如何加拼音_[编程心得]用Python给汉字加上带音调的拼音

本文介绍了如何使用Python将汉字转换为带有音调的拼音,特别是修复了原有代码在处理特定韵母时的错误,适用于增强拼音学习的训练方案。通过读取码表文件,将汉字转为utf16编码,并匹配韵母添加声调,解决了多音字和特殊韵母的处理问题。
摘要由CSDN通过智能技术生成

作为一个南方人,拼音没学好那似乎已是一件非常正常的事。什么卷舌音、鼻音,也只有在近几年才算是分清了一部分。但尴尬的事情仍在继续,发短信的时候,总有些字拼得不准;说话的时候,总有些字没有卷舌、或忘了加鼻音……痛定思痛,于是有了一个用SuperMemo来强化拼音的训练方案。

要实现这个方案,得具备两个条件,一是选定汉字范围——舍得选的是一级国标汉字,共计3700余个;二是利用程序将这些汉字转化为拼音,要求拼音带上音调,这个就需要对转换精灵进行适度的改造。

舍得以HzqGhost(小强)童鞋的代码为蓝本,进行了如下的改造: 编码部分采用这份码表:下载地址

源代码为python2.x的,改造为python 3.x;

在给韵母添加声调的部分代码,原代码有个别地方出现错误,在我家傻妹的提醒下,舍得修复了这一错误;

下面是相关的部分代码,分段描述:

1、读入码表文件,转成dict: fileName = './Mandarin.dat'

self.dict = {}

for line in open(fileName):

k, v = line.split('\t')

self.dict[k] = v

2、然后对传入的中文字符串进行处理:

self.yunmu = ( 'ang','eng','ing','ong','an','en','in','un',&#

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值