.net 数字转汉字_Python实现文字转语音功能

点击上方   编程学习者社区,选择   创建星标

回复关键字   资源   获取编程资料

a184ae988bc5c4542a6c3aceaaf05aad.png

请输入标题     bcd

在自然语言处理上,文字、音频互转是一个很关键的技术点。对于语音转文字,这个个人实现较为困难,我们可以使用语音转文字的软件或借助各API(如科大讯飞等)进行移植开发。不过文字转语音就相对而言容易实现很多了。 简言之, 汉字转语音实现就分为两步,第一步将汉字转为拼音,第二步通过拼音调用相匹配的音频文件。下面是具体的开发实例教程。

环境配置

开发环境:WindowsPython版本:3.x外置模块准备:pygame(可直接在cmd命令行中pip install pygame安装)

汉字转语音

我使用的是将汉字转为Unicode码,然后通过查询一个匹配文件(我使用的是unicode_pinyin.txt)获取该汉字的拼音,该文件中列有从4E00-9FA5标准汉字的Unicode编码所对应的拼音,外加一个落单的3007编码的“〇”。

文件如下:

84f370c0daf20d2fb1e849ee58f85298.png

文件链接:

https://pan.baidu.com/share/initshareid=1866601421&uk=4013012087

提取密码:fge1

在大写拼音英文后的1,2,3,4,5分别表示一,二,三,四和轻声(注意到存在有多音字)

我们将其封装成一个函数,参数为一个全是汉字的字符串,返回是一个拼音字符串。(即chinese_to_pinyin("秋水共长天一色") 返回的是
"QIU1 SHUI3 GONG4 CHANG2 TIAN1 YI1 SE4 ")

源码如下:

def chinese_to_pinyin(x):    y = ''    dic = {}    with open("unicode_pinyin.txt") as f:        for i in f.readlines():            dic[i.split()[0]] = i.split()[1]    for i in x:        i = str(i.encode('unicode_escape'))[-5:-1].upper()        try:            y += dic[i] + ' '        except:            y += 'XXXX ' #非法字符我们用XXXX代替    return y

说明:将该文件与"unicode_pinyin.txt"文件放在同一目录下,代码比较简陋,因为主要给大家讲实现教学,所以没有对多音字进行处理(所以默认使用第一个使用频率最高的音)

拼音转语音

这一步也比较简单,我们根据拼音调用相对应的单个音的音频文件即可。单个音的音频文件可以自己录或找人录,渠道有很多哦。注意文件格式,最好是mp3或wav文件。

部分文件展示如下: d086c659e5b18b9d96878de3a8c04e07.png


我们将其置入一个vioce文件夹下。准备工作就做好了。

我们同样将汉字转语音封装成一个make_vioce函数,参数为一个汉字字符串,然后调用chinese_to_pinyin函数,返回值不重要,可为空,功能实现是调用音频文件发音。测试时请在Python自带的IDLE中运行。

源码如下:

import pygamedef make_vioce(x):    pygame.mixer.init()    vio = chinese_to_pinyin(x).split()    for i in vio:        if i == 'XXXX':  #处理'XXXX'的音,可将其忽略            continue        pygame.mixer.music.load("vioce/" + i + ".mp3")        pygame.mixer.music.play()        while pygame.mixer.music.get_busy() == True:            pass    return None

我们展示一下这个教学版的最后完整的代码图(该文件名为"test.py"):

import pygame

def chinese_to_pinyin(x):    y = ''    dic = {}    with open("unicode_pinyin.txt") as f:        for i in f.readlines():            dic[i.split()[0]] = i.split()[1]    for i in x:        i = str(i.encode('unicode_escape'))[-5:-1].upper()        try:            y += dic[i] + ' '        except:            y += 'XXXX '    return ydef make_vioce(x):    pygame.mixer.init()    vio = chinese_to_pinyin(x).split()    for i in vio:        if i == 'XXXX':            continue        pygame.mixer.music.load("vioce/" + i + ".mp3")        pygame.mixer.music.play()        while pygame.mixer.music.get_busy() == True:            pass    return Nonewhile True:    p = input("请输入文字:")    make_vioce(p)

教程文件的文件树结构

请题     abcde教程文件的文件树结构

test.pyunicode_pinyin.txtvioce----A1.mp3         A2.mp3         A3.mp3         ...

请输入标题     abcdefg

再次强调一下:这个教学test请在IDLE中运行,需要直接运行的话还需要做一些小调整。

实现原理就是这样,同时也可以视一些具体情况做一些拓展,例如将阿拉伯数字转汉字读法(即1234006.15读作“一百二十三万四千零六点一五”,这个实现不难),还有将多音字问题攻破也是很棒的。

当然只要想法够丰富用pygame的音频功能也能实现很多有趣的功能(如播放器制作或电子音乐简单创作等)。

end

来源:知乎【王芽树】

https://zhuanlan.zhihu.com/p/26726297

往期精选

  • 在知乎上学Python-入门篇

  • 在知乎上学爬虫

  • 大家都用什么背英语单词

  • Python库分享

8633e2f5612f0b6b9c9db7ee567e9779.gif

cfee47bf74b76c7bb461a532b5d86e0d.gif

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值