语音识别
一路向难走
除了生活,没什么是重要的一一容余
展开
-
语音识别-DTW算法
语音识别,声音的特征通过mfcc算出来了以后,我们进行进行跟模板对比,进行判断语音的内容了先录制“目标词”语音,计算出MFCC保存,然后通过录音录入声音,进行计算MFCC,然后跟目标词进行对比,对比使用DTW算法DTW参考:https://blog.csdn.net/zouxy09/article/details/9140207算法实现 C语言,C++比较多Imports System.Colle...转载 2018-05-16 15:39:00 · 3207 阅读 · 0 评论 -
端点检测
语音识别从声音进行电脑后,一般先进行端点检测,即将语音的部分与外界的噪音或是静音分割开来,以减少计算机的计算负担,从而更快进行识别端点检测的算法比较多,一般就通过,过零率,能量值来进行判断...原创 2018-05-22 15:45:52 · 2184 阅读 · 0 评论 -
MFCC计算 VB.NET
Imports System.Collections.GenericImports System.LinqImports System.NumericsImports MathNet.NumericsImports MathNet.Numerics.IntegralTransformsImports System.TextImports System.Threading.TasksImports ...原创 2018-05-07 15:49:08 · 312 阅读 · 0 评论 -
语音识别基础
语音识别 我们的声音进入电脑后,变成了下面的结构 (上面这个图也叫声音的“时域”图,因为声音通过话筒进入计算机,是按时间上的先后顺序来的) 我们来“描述”一下,他有什么特征:1. 中间区域内,“振荡”幅度特别大,而两边变化的比较小,(中间区域的内容是“yi”的发音的声音图两边的地方是“静音区”,即在录音开始时,我们没有发出声音,但电脑已经开始录制了,但这部份,没有声音;在声音这部份区域...原创 2018-05-05 19:12:42 · 1003 阅读 · 0 评论 -
科大讯飞 语音识别 VB WIN10 X64 VS2017
若使用C# ,请用CS转VBConverter 工具转换Imports System.Runtime.InteropServicesImports System.IO#Const _Debug = 1#Const _WriteWaveFile = 0Public Class SpeechRecogWav Dim _appid As String Public Sub New(appid...原创 2018-05-01 11:50:27 · 1664 阅读 · 0 评论 -
tf-7.中文语音识别 tensorflow
源来自:http://blog.topspeedsnail.com/archives/10696 (在python3.5下编辑中有错误修正来自:http://blog.csdn.net/sinat_30665603/article/details/74897891数据集:http://data.cslt.org/thchs30/standalone.html代码:#coding:转载 2018-01-20 10:48:28 · 1225 阅读 · 1 评论 -
python中Librosa的mfcc步骤
1.对语音数据归一化如16000hz的数据,会将每个点/327682.计算窗函数:(*注意librosa中不进行预处理)3.进行数据扩展填充,他进行的是镜像填充("reflect")如原数据为 12345 -》 填充为4的,左右各填充4 即:5432123454321 即:5432-12345-43214.分帧5.加窗:对每一帧进行加窗, 6.进行fft傅里叶变换libro...原创 2018-07-01 18:38:54 · 3723 阅读 · 0 评论