视听觉信号与处理·实验一

一.帧时长计算

通俗的讲采样频率是指计算机每秒钟采集多少个信号样本,比如声音信号,此时采样频率可以是描述声音文件的音质、音调,衡量声卡、声音文件的质量标准。采样频率越高,即采样的间隔时间越短,则在单位时间内计算机得到的样本数据就越多,对信号波形的表示也越精确。采样频率与原始信号频率之间有一定的关系,根据奈奎斯特理论,
只有采样频率高于原始信号最高频率的两倍时,才能把数字信号表示的信号还原成为原来信号。在数字音频领域,常用的采样率有:
8000Hz 电话所用采样率,对于人的说话已经足够
11025Hz 获得的声音称为电话音质,基本上能让你分辨出通话人的声音
22050Hz 无线电广播所用采样率,广播音质

https://baike.baidu.com/item/采样频率/1494233?fr=aladdin
从而,计算帧时长的方法:
假设帧长=256个采样点,采样频率为:fs=16000.则一秒采了16000个样本.
一帧时长=1/16000256=0.0165625s。
写成matlab代码:
frameTime=1/fs
frameLength;

二.端点检测原理

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
那么这个阈值要怎么选呢?这个门限的选取是遵从什么样的规则呢。
在这里插入图片描述

这里的E是过零率,M是平均幅度,E是能量。 S是无声,U是清音,V是浊音。 其中清音过零率最大,浊音能量最大。

在这里插入图片描述
由上图可以看到,
双门限法:
(1)用较高的短时能量门限Mh确保是浊音。确定为A1-A2
(2)短时能量>较低的门:M1的还是语音段。确定为B1-B2
(3)从B1开始向前搜索,短时过零率>门限Zs的是清音部分。
从B2向后搜索,短时过零率>门限Zs的是清音部分。
那这里的MH,ML,Zs怎么确定呢。

转载于:https://www.cnblogs.com/hitWTJ/p/9865409.html

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值