![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
语音识别
chenpe32cp
大道至简
展开
-
序列模型简介——RNN, Bidirectional RNN, LSTM, GRU
好文章,记录于此,点击这里查看译文转载 2019-03-25 19:22:34 · 438 阅读 · 0 评论 -
MFCC-梅尔倒谱系数学习
本文转载于这里最近在学习语音识别相关知识,本篇博文是一个很好的MFCC入门文章,不涉及太多数学公式,原理清晰易懂。zouxy09@qq.comhttp://blog.csdn.net/zouxy09 在任意一个Automatic speech recognition 系统中,第一步就是提取特征。换句话说,我们需要把音频信号中具有辨识性的成分提取出来,然后把其他的乱七八糟...转载 2019-03-26 11:43:11 · 392 阅读 · 0 评论 -
使用Python操作音频文件,提取音频特征
http://bigsec.net/b52/scipydoc/wave_pyaudio.htmlhttps://blog.csdn.net/Xwei1226/article/details/83781157转载 2019-07-02 16:24:33 · 3969 阅读 · 0 评论 -
python 对任意文件(jpg,png,mp3,mp4)base64的编码解码
最近调用腾讯ai开发平台的语音合成接口,将文字转为语音数据后,得到的语音格式为base64,那么啥是base64编码,又如何将其转为mp3格式呢?作为一名面向百度的编程爱好者,看完一篇博客后就秒懂了。直接搬运过来,感谢作者分享。Python的base64函数是内置函数,是一种用64个字符来表示任意二进制数据的方法。用记事本打开exe、jpg、pdf这些文件时,我们都会看到一大堆乱...转载 2019-06-27 18:37:35 · 4586 阅读 · 0 评论