⛄一、DTW简介
近年来,语音识别技术得到了长足的发展,已经广泛应用于各个领域。其中,电话按键语音识别是一种常见的应用场景。本文介绍了一种基于过零率特征实现电话按键语音识别的方法, 并提供了相应的Matlab源代码。
1 概述
电话按键语音识别是指将电话拨号声音转换成数字,以及将数字转换成电话拨号声音。其实质是对时域信号进行数字信号处理,从而实现语音信号的自动识别。
本文所介绍的基于过零率特征实现的电话按键语音识别方法,是利用语音信号在正常人说话时无法避免的一种现象。这种现象就是语音信号中存在着大量的过零点。根据过零点的数量和分布情况可以判断出语音信号的特征。
2 算法介绍
该算法主要包含以下几个步骤:
(1)读取语音信号(wav格式) 。
(2)对语音信号进行预处理,如去噪,去除静音段等。
(3)分帧:将语音信号分成若干个长度相等的帧,每帧的长度一般为20ms到30ms之间。
(4)计算每帧的过零率:过零率即信号通过0的次数。
⛄二、部分源代码
clear all
clc
[x0,Fs]=audioread(‘1234567890.wav’);
%sound(x0,Fs);
N=length(x0); %采样点
k=(0:N-1);
f=(k/N-1/2)*Fs;
X0=fft(x0);
figure
subplot(2,1,1),plot(x0)
title(‘原始按键音(时域)’),xlabe