斜率判别声音
说话跟语音的幅度情况
说话
纯音乐-classic
差不太多
读取语音数据得到幅度图
斜率
从0往两边依次求出相邻区间的斜率
根据得到的区间频数和区间中点值来算出两两斜率
对比说话跟纯音乐曲线
幅频曲线
说话斜率变化比较小
推测(错了
根据概率分布直方图,依次求出右半部份两两相间的斜率。再求斜率的均值。
1.读取数据为:普通话等级考试
共11个
测得结果
语音占比为 72.727273%
2.读取数据为:classic-纯音乐
共100个。
测得结果
语音占比为 24.000000%
3.但是音乐加入了歌声
数据为:hip-pop
共100个
测得结果
语音占比为 96.000000%
4.调低均值(mean® .测得数据会好点,但都会说话跟纯音乐都会降低。
求函数,根据斜率,看凹凸性?
拟合出来函数,然后求其倒数,看凹凸性?
1.用自己得出的函数
推测部分
2.用matlab自带的工具拟合,计算
未果,还没把函数搞出来
调值改变其占比。
斜率判别声音2
meanfreq :平均频率,频率以幅度为权值的加权平均值
sd :频率幅度加权的标准偏差
直方图
普通话
钢琴
频率分布图
说话
钢琴
合起来
蓝色为说话,红色为音乐
x轴为幅度,y轴为个数的对数:
(带入其他音乐看看效果
频率分布:
[外链图片转存失败(img-6nAn084n-1563360355009)(D:\matlab\assets\频率分布点图.jpg)]
平均斜率分布:
[外链图片转存失败(img-qNYHW4c1-1563360355010)(D:\matlab\assets\斜率分布.jpg)]
标准差分布:
[外链图片转存失败(img-u8i5fbiO-1563360355010)(D:\matlab\assets\方差.jpg)]
拟合
伽玛函数是最匹配语音信号的,用其来测试凹凸性分辨语音跟音乐
这是伽玛拟合
[外链图片转存失败(img-d6WJf3sM-1563360355010)(assets/伽玛拟合.jpg)]
对数形式
[外链图片转存失败(img-5zzNGQOn-1563360355011)(assets/伽玛拟合对数.jpg)]
带入所有数据
其他是包含说话的音乐
[外链图片转存失败(img-j7PaO1aP-1563360355013)(assets/所有数据的伽玛拟合.jpg)]
导入所有数据求其二阶导数
(编程上,求导遇到问题
单个音频的二阶导对比
[外链图片转存失败(img-dsxApBrX-1563360355013)(assets/单个音频对比二阶导.jpg)]
语音:红色为原始信号,蓝色为求导后的信号,音乐同理
[外链图片转存失败(img-LI7J9sCU-1563360355014)(assets/说话求导对比.jpg)]
[外链图片转存失败(img-SIUo6leH-1563360355015)(assets/音乐对比.jpg)]
差不多
代码
%求导
clear ;
clc;
syms o;
data=audioread('030.wav');
[n,x]=hist(data,100);
a=std(data);
k=sqrt(3)/2*std(data);
g=sqrt(k)/(2*sqrt(pi)*a)*exp(-k*abs(o))/sqrt(abs(o));
gd=diff(g,2);
for i=1:length(x)
y(i)=subs(gd,x(i));
end
plot(x,y)
同一张图上:
[外链图片转存失败(img-xM67gStv-1563360355015)(assets/语音音乐求导对比图.jpg)]
[外链图片转存失败(img-mMmSucQW-1563360355016)(assets/语音音乐说话求导对比图.jpg)]
(数据要算时先要经过数据处理,没有处理的算出来不对
根据幅度加权
不拟合,直接来判断
单个音频斜率点图,对比
[外链图片转存失败(img-sLasOl7w-1563360355016)(assets/单个音频频率点图.jpg)]
全部数据的点图
[外链图片转存失败(img-yp3wMWFY-1563360355017)(assets/全部点图.jpg)]
语音比音乐在频率较高的部分比较多。
1.直接统计这一部分判断语音?
(有偏差。根据直方图划分的不同,有点偏差
2.斜率,在幅度值为0.001~0.05之间
在幅值中点的频率离原点的距离。
(D:\matlab\测试样本-钢琴,普通话\缩小测试数据-歪度
3.在幅值中点的频率离原点的距离二阶导(未
偏斜度
https://wenku.baidu.com/view/cb53e7557f1922791688e8d0.html
α
=
1
N
∑
i
=
1
N
(
x
i
−
x
‾
)
3
\alpha=\frac{1}{N}\sum_{i=1}^{N}(x_i-\overline x)^3
α=N1i=1∑N(xi−x)3
反映对纵坐标的不对称性,值越大,不对称越厉害。
(根据数据大小,有点偏差 D:\matlab\测试样本-钢琴,普通话\缩小测试数据-歪度
COBB
http://www.360doc.com/content/15/0429/10/22947153_466753899.shtml
关于脊椎侧弯标准测量方法
(还未