汉字拼音数据库_WinDev

博主分享了一篇关于如何使用WinDev语言处理一个包含汉字拼音的开源数据库,通过筛选和处理txt文件,将带有声调的拼音转换并存储到数据库中。文中详细介绍了处理过程,包括提取和替换声调、将数据存入HyperSQL数据库。
摘要由CSDN通过智能技术生成

原创文章,引用转载请注明作者出处。


针对上一篇博文--汉字转拼音的程序,我在这里写一下程序用的数据库。我显示从网上找了一个开源数据库,是cedit的,下载下来之后是txt文件,而且里面处理简体中文还有繁体中文,还有英语的翻译,原txt内容的部分截图如下:


所以要先对txt文件进行筛选,只留下简体汉字跟拼音,代码如下(WinDev语言,法文版)

MonBuffer est un Buffer 
MonBuffer = fChargeTexte("C:\Users\stagiaire57\Desktop\Notes\BD_donne\cedit.txt")
MaChaîne est une chaîne UNICODE 
MaChaîne = MonBuffer
nIDFichier est int= fOuvre("C:\Users\stagiaire57\Desktop\Notes\BD_donne\cedittestSimplifie.txt", foLectureEcriture)
i est un int=1
TANTQUE ExtraitLigne(MaChaîne,i)<> EOT  //<>是不等于的意思,就是说只要不等边界付就继续执行,一旦等于就停止执行。
unechaine est une chaîne=ExtraitLigne(MaChaîne,i)
//sUneNouvelleChaine1 est une chaîne=ExtraitChaîne(unechaine,1," ",DepuisDébut)
sUneNouvelleChaine2 est une chaîne=ExtraitChaîne(unechaine,2," ",DepuisDébut)
sUneNouvelleChaine3 est une chaîne=ExtraitChaîne(unechaine,2,["[","]"," and "])
sUneNouvelleChaine4 est une chaîne=sUneNouvelleChaine2+TAB+sUneNouvelleChaine3
fEcritLigne(nIDFichier,sUneNouvelleChaine4)
i++
FIN

可以看出WinDev非常方便,几行代码就解决了可能其他语言要写一页的代码。处理后的txt文件如下:


那么现在大家可以清楚地看到,原始txt文件里面的拼音虽然有声调,但是都是用数组表示的,并没有真正的显示在字母上面,下面就是我的程序的新颖的地方,我把声调加在了相应的字母上面,然后再把数据放到数据库里面。代码如下:

PROCEDURE DetecterETchanger(UnPinyin):chaîne UNICODE
sChaineTest est une chaîne UNICODE=Milieu(UnPinyin,Taille(UnPinyin),1)


sLettreAremplace est une chaîne UNICODE=""
sLettreRemplace est une chaîne UNICODE=""


nTrouve est un entier=0


SI ChercherVoyelle(UnPinyin,"a")=Vrai ALORS
nTrouve=1
sLettreAremplace="a"
SE

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值