一、实验目标:
把自己(男)的声音分别变成小孩的声音、女人的声音和老人的声音。
二、变声原理:
语音科学家将人类发声过程视作一个由声门源输送的气流经以声道、口、鼻腔组成的滤波器调制而成的。人类语音可分为有声语音和无声语音,前者是由声带振动激励的脉冲信号经声腔调制变成不同的音,它是人类语言中元音的基础,声带振动的频率称为基频。
无声语音则是声带保持开启状态,禁止振动引发的。一般来说,由声门振动决定的基频跟说话人的性别特征有关,如下表,而无声语音则没有体现这个特征。说话人的个性化音色和语音的另外一个声学参数——共振峰频率的分布有关。儿童由于声道短,其共振峰频率高于成年人,成年女性的声道一般短于成年男性,所以女性的共振峰频率一
般高于男性。
由上可知,在进行性别变声时,主要考虑基频和共振峰频率的变化。当基频伸展,共振峰频率也同时伸展时,可由男声变成女声,女声变成童声;反之,基频收缩,共振峰频率也同时收缩时,则由童声变女声,女声变男声。为了获得自然度、真实感较好的变声效果,基频和共振峰频率通常必须各自独立地伸缩变化如图1。
图1 基频和共振峰频率分布的变化
共振峰频率的改变是基于重采样实现的,从重采样原理知道,这也同时引发了基频的变化,为保证基频变化和共振峰频率变化的独立、互不相关,在基频移动时必须考虑抵消重采样带来的偏移,理论上只要基频检测足够精确,确实可以保证基频改变和共振峰频率改变间的互不相关。
三、设计方案:
1、录入自己(小孩、女人、老人)的一段声音
2、用MATLAB做fft得到其频谱
3、做fft频谱分析
4、搬移和改变基频、语速,实现变声
四、程序实现
1、变大变小声音
[y,Fs]=audioread('C:\Users\ASUS\Desktop\杜\隋佳新.wav');%读出信号,采样率和采样位数。
sound(0.5*y,Fs)%变小声音
filename = ('C:\Users\ASUS\Desktop\杜\变小.wav'); %给文件取名
audiowrite(filename,0.5*y,fs) %存储.wav音频文件,在这里文件名
sound(2*y,Fs)%变大声音
filename2 = ('C:\Users\ASUS\Desktop\杜\变大.wav'); %给文件取名
audiowrite(filename2,2*y,fs) %存储.wav音
2、原语音信号频谱分析然后频谱搬移调速改变声音
%这次作业录制的语音信号是WAV格式,通过audioread()函数读取了语音数字信号的采样频率和数据。
%首先观察原始语音的频谱和波形
clear
clc
[s,fs]=audioread('C:\Users\ASUS\Desktop\杜\原声.wav');%声音读取
s = s/max(s); %归一化
L = length(s); % 读入语音长度
S=fft(s,L);
figure
subplot(2,1,1);
plot(s);
title('原语音信号波形');
subplot(2,1,2);
plot(abs(S));
title('原语音信号频谱');
fs2=fs-25000;%基频搬移到男生频谱段
audiowrite('C:\Users\ASUS\Desktop\杜\女变男.wav',s,1.2*fs2)%对速度进行改变
(1)根据以上频谱知,该女生的语音信号频谱在230HZ左右,对其进行搬移到[50, 180] 之间,并进行变速就可得到男声,老年声。代码如下:
fs2=fs-25000;%基频搬移到男生频谱段
audiowrite(‘C:\Users\ASUS\Desktop\女变男.wav’,s,1.2*fs2)%对速度进行改变
(2)通过对输出音频进行分析知该方案可行,有实验程序知:
```cpp
function Y=voice(x,f) %更改采样率使基频改变 f>1降低;f<1升高
f=f+0.15;
f=round(f*1000);
d=resample(x,f,1000); %时长整合使语音文件恢复原来时长
W=400;Wov=W/2;Kmax=W*2;Wsim=Wov;
xdecim=8;
kdecim=2;
X=d';
F=f/1000;
Ss =W-Wov;
xpts = size(X,2);
ypts = round(xpts / F);
Y = zeros(1, ypts);
xfwin = (1:Wov)/(Wov+1);
ovix = (1-Wov):0;
newix = 1:(W-Wov);
simix = (1:xdecim:Wsim) - Wsim;
padX = [zeros(1, Wsim), X, zeros(1,Kmax+W-Wov)];
Y(1:Wsim) = X(1:Wsim); lastxpos = 0; km = 0;
for ypos = Wsim:Ss:(ypts-W)
xpos = round(F * ypos);
kmpred = km + (xpos - lastxpos);
lastxpos = xpos;
if (kmpred <= Kmax)
km = kmpred;else
ysim = Y(ypos + simix);
rxy = zeros(1, Kmax+1);
rxx = zeros(1, Kmax+1);Kmin = 0;
for k = Kmin:kdecim:Kmax
xsim = padX(Wsim + xpos + k + simix);
rxx(k+1) = norm(xsim);
rxy(k+1) = (ysim * xsim');
end
Rxy = (rxx ~= 0).*rxy./(rxx+(rxx==0));
km = min(find(Rxy == max(Rxy))-1);
end
xabs = xpos+km;
Y(ypos+ovix) = ((1-xfwin).*Y(ypos+ovix)) + (xfwin.*padX(Wsim+xabs+ovix));
Y(ypos+newix) = padX(Wsim+xabs+newix);
end
end
(3)调用该函数的脚本文件为:
```bash
[y,fs]=audioread('C:\Users\ASUS\Desktop\杜\小学生的语音.wav'); %读取声音文件
x1=y(:,1); %读入的y矩阵有两列,取第1列,取一个通道
sound(voice(x1,2),fs);
N=length(voice(x1,1.5)); %长度
n=0:N-1;
w=2*n*pi/N;
y1=fft(voice(x1,1.5)); %对原始信号做FFT变换
subplot(2,1,1);
plot(n,voice(x1,1.5)) %做原始语音信号的时域波形图
title('变声语音信号时域图');
xlabel('时间t');
ylabel('幅值');
subplot(2,1,2); %做原始语音信号的频谱图
plot(w/pi,abs(y1));
title('变声语音信号频谱')
xlabel('频率');
ylabel('幅度');
filename = ('C:\Users\ASUS\Desktop\杜\变老人.wav'); %给文件取名
audiowrite(filename,x_z,fs) %存储.wav音频文件,在这里文件名
上述函数代码可通过更改采样率使基频改变 f>1降低;f<1升高来改变声音频率进行变声。
五、结论
1改变频谱可以实现变声;
2改变基频可以变声;
3共振峰与基频是变声的重点;
4、MATLAB可以做频谱分析,通过这次作业我更深的理解了MATLAB这个工具。
5、编程基本可以实现变声。目标可以实现!
六、实验组讨论