ASR
文章平均质量分 75
小白羊000
这个作者很懒,什么都没留下…
展开
-
SRILM语言模型库安装
N-gram 语言模型SRILM的安装原创 2022-01-12 16:32:12 · 2180 阅读 · 1 评论 -
VS2017中,实现C#调用.py打包的.exe文件(pytorch网络)
两部分:1、使用pyinstaller打包xxx.py的项目文件,生成.exe文件; 2、简单C#的交互界面,实现.exe文件的调用与传参(文件名)。c#实现功能:1)点击浏览文件夹,选中文件(文件路径供.exe使用), 2)点击浏览文件夹,再选中.exe文件; 3)点击,执行.exe文件;显示输出结果——string类型(xx.py中,print(“”)的内容)本文实现...原创 2021-10-13 13:24:42 · 1376 阅读 · 1 评论 -
2021-04-27
本文主要为代码整合贡献,主要贡献为参数解释,原理见参考文章。 基于python语言,有使用库函数5行解决问题;还有一步步实现搭建50行实现。如何获取39维MFCC信号,即 能量 + 12维mfcc信号 + 13维度detla + 13维detla - detla。39维MFCC信号用与GMM - HMM语音识别。原创 2021-04-27 14:56:02 · 436 阅读 · 0 评论 -
TTS:访问百度tts完成文本转文字
一、TTS,文本转语音?TTS(text to speech):文本转语音,即语音生成技术。目的:想通过调用API完成,批量的短音频数据(.wav/mp3)合成音频数据集。用于特定场景的的ASR任务。方法:查找,查找,找到,做记录。方法来源:https://blog.csdn.net/Cykinter/article/details/107215464?utm_medium=distribute.pc_relevant.none-task-blog-baidujs_title-8&s原创 2021-03-16 13:05:52 · 1235 阅读 · 0 评论