视频会议混音算法

视频会议混音算法

总结一下我对混音算法的学习,大概有以下几种方式:
1. 直接加和: 缺点:极易产生溢出;
2. 加和后再除以混音通道数,防止溢出

优点:不会产生溢出,噪音较小;
缺点:衰减过大,影响通话质量;


3. 加和并箝位,如有溢出就设最大值(当发生上溢时,箝位以后的值为所能表示的最大值,当发生下溢时,箝位后的值为所能表示的最小值)

缺点:在溢出的地方引入了严重的噪音


4. 饱和处理,接近最大值时进行扭曲(“软件混音的实现”一文算法就是这类)
5. 归一化处理,全部乘个系数,使幅值归一化。(只适用于文件)
6. 衰减因子法,用衰减因子限制幅值[1]。自适应加权混音算法
思路:使用更多的位数(32 bit)来表示音频数据的一个样本,混完音后在想办法降低其振幅,使其仍旧分布在16 bit所能表示的范围之内,这种方法叫做归一法;
方法:为避免发生溢出,使用一个可变的衰减因子对语音进行衰减。这个衰减因子也就代表语音的权重,衰减因子随着音频数据的变化而变化,所以称为自适应加权混音。当溢出时,衰减因子较小,使得溢出的数据在衰减后能够处于临界值以内,而在没有溢出时,又让衰减因子慢慢增大,使数据较为平缓的变化。

直接加和,或除以通道数的混音方法有严重缺陷,效果可能很差。箝位法最大混音数大约是4个,饱和处理最大混音数可能再高几个。对于大量的混音,应该采用衰减因子法。

文献[2]提出了一个自对齐权重法(align-to-self weighted,简称ASW),以一个时间帧为单位进行衰减,可能在帧之间有断续,效果应该不如平滑的衰减。

如果[1]中的衰减因子计算时能考虑整个时间片的数据,而不仅仅是当前点,那样效果会更好吧。



视频会议中混音后溢出问题的研究及解决方法: http://www.doc88.com/p-70383188302.html







改进的视频会议系统混音算法及实现: http://www.docin.com/p-152526527.html



多媒体会议中新型快速实时混音算法: http://www.docin.com/p-44764192.html


一种新的多媒体会议实时混音方案: http://www.docin.com/p-90140079.html

多媒体会议自适应音频混音算法研究:  http://www.docin.com/p-212853820.html


基于VOIP的多媒体会议混音模型: http://www.docin.com/p-242337343.html

一种多媒体会议系统的实时同步混音转发算法: http://www.docin.com/p-63211754.html#documentinfo

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值