语音断点检测(短时改进子带谱熵)

13 篇文章 10 订阅
4 篇文章 1 订阅

1. 音频分析

1.输出语音的切分时间点信息,时间点用毫秒表示;
2.把语音分割成多个wav文件;

端点检测:确定句子的时间起始点和终点,忽略中间少量的非语音帧,
用于语音识别。(Speech Endpoint Detection)

熵在信息论中是反映信息度量的一个量。某随机事件的随机性越大,
即不确定性越高,则熵值也越大,所以携带的信息量亦越大。
本次作业采用 谱熵法 对语音进行端点检测。

2. 谱熵法

在这里插入图片描述
在这里插入图片描述

3. 预处理

在这里插入图片描述

4. 双门限法端点检测

在这里插入图片描述

5. 实验结果

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

处理 PHONE_001.wav 得到的信息
(1)time.csv: 为语音切段信息;
(2)PHONE_001_vad.wav:为语音VAD处理后,语音段合成的wav;
(3)segmentation文件夹: 为语音分段后各小段的语音;
(4)main_VAD.m: 主函数;
(5)vad.m: 为双门限法端点检测函数;
(6)houzhichuli.m: 为间歇长度判定函数;
(7)frame2time.m: 为帧对于的时间函数;

代码:
VAD
+qq:1095982611; 80% discount

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

qq-120

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值