回声消除性能评判指标

回声消除性能评判指标

​ 为了反映回声消除中自适应滤波器 r 1 ( n ) r_1(n) r1(n)对真实回声路径r(n)的逼近程度。系统距离,定义为:
D I S T ( n ) = 10 l g ∣ ∣ r 1 ( n ) − r ( n ) ∣ ∣ 2 ∣ ∣ r ( n ) ∣ ∣ 2 DIST(n) = 10lg \frac{||r_1(n)-r(n)||^2}{||r(n)||^2} DIST(n)=10lgr(n)2r1(n)r(n)2
​ 其中DIST值越低,表明自适应滤波器的收敛性能越好

​ 为了衡量回声消除效果,因为单讲和双讲场景对输出信号e(n)要求不一样,只有近端单讲时要求e(n)与麦克风采集信号d(n)尽量一致,只有远端单讲时需要对e(n) 尽量抑制,双讲时需要保持近端语音尽量一致同时抑制回声,所以我们对单讲双讲部分需要使用不同指标进行评价。

1,ERLE(Echo Return Loss Enhancement,回声返回衰减增益):
E R L E = 10 l g E [ d 2 ( n ) ] E [ e 2 ( n ) ] ERLE = 10lg \frac{E[d^2(n)]}{E[e^2(n)]} ERLE=10lgE[e2(n)]E[d2(n)]

​ ERLE值越大,则表明回声抵消效果越好。由于双讲或只有近端单讲时,e(n)中包含近端语音,导致很多情况下e(n)的能量远大于回声y(n)的能量,从而ERLE为负值,同时也无法衡量回声部分的消除情况。

​ 对于优秀的回声消除器,返回衰减增益必须不低于6dB.

2,SuppFactor(能量衰落因子)

​ AEC后输出能量与对应麦克风信号能量的比值。
S u p p F a c t o r = E [ ∣ e ∣ 2 ( n ) ] E [ ∣ x ∣ 2 ( n ) ] SuppFactor = \frac{E[|e|^2(n)]}{E[|x|^2(n)]} SuppFactor=E[x2(n)]E[e2(n)]
3,cohde(输出信号e(n)与麦克风信号d(n)的频谱相关性)

​ 该值越接近1,说明输出信号中保留的麦克风信号频谱越多。考虑到麦克风信号d(n)主要由回声信号y(n)和近端语音v(n)构成,因此只有近端单讲情况下cohde的值才能接近1,双讲情况下cohde的值在0.5~0.9(取决于回声信号在该帧的占比),当cohde接近0时说明输出信号几乎不包含任何近端语音和回声的频谱成分。其计算公式如下:
S d = D ( ω ) D ∗ ( ω ) S_d = D(\omega)D*(\omega) Sd=D(ω)D(ω)

S e = E ( ω ) E ∗ ( ω ) S_e = E(\omega)E*(\omega) Se=E(ω)E(ω)

S d e = D ( ω ) E ∗ ( ω ) S_{de} = D(\omega)E*(\omega) Sde=D(ω)E(ω)

C o h d e = ∣ S d e ∣ 2 ∣ S d ∗ S e ∣ Cohde=\frac{|S_{de}|^2}{|S_d*S_e|} Cohde=SdSeSde2

4,cohxe(输出信号e(n)与远端参考信号x(n)的频谱相关性)

​ 该值越接近0,说明输出信号中残留的远端参考信号频谱越少,回声消除越彻底,其计算公式如下:
S x = X ( ω ) X ∗ ( ω ) S_x = X(\omega)X*(\omega) Sx=X(ω)X(ω)

S e = E ( ω ) E ∗ ( ω ) S_e = E(\omega)E*(\omega) Se=E(ω)E(ω)

S x e = X ( ω ) E ∗ ( ω ) S_{xe} = X(\omega)E*(\omega) Sxe=X(ω)E(ω)

C o h x e = ∣ S x e ∣ 2 ∣ S x ∗ S e ∣ Cohxe=\frac{|S_{xe}|^2}{|S_x*S_e|} Cohxe=SxSeSxe2

不同通话状态对应的参数指标:

1,近端单讲(最大程度保持输出与麦克风信号一致)

​ cohde:越接近1说明输出与麦克风信号越相似,越接近0说明两者差异越大,近端单讲时理想值为1。

​ cohxe:越接近1说明输出与远端参考信号越相似,越接近0说明两者差异越大,即残留的远端参考信号频谱成分越少,理想值为0。

​ SuppFactor:越接近1说明输出与麦克风信号的能量越接近,越接近0说明AEC造成能量衰落越严重,近端单讲时理想值为1。

2. 远端单讲最大程度抑制回声):

​ ERLE:值越大越好,则表明残留回声的能量相对值越小,回声抵消效果越好。

​ cohde:越接近1说明输出与麦克风信号越相似,越接近0说明两者差异越大,远端单讲时理想值为0。

​ cohxe:越接近1说明输出与远端参考信号越相似,越接近0说明两者差异越大,即残留的远端参考信号频谱成分越少,理想值为0。

​ SuppFactor:越接近1说明输出与麦克风信号的能量越接近,越接近0说明AEC造成能量衰落越严重,远端单讲时理想值为0。

3. 双讲尽量抑制回声同时保留近端语音

​ cohde:越接近1说明输出与麦克风信号越相似,保留的近端语音频谱成分也越多;越接近0说明两者差异越大,保留的近端语音频谱成分也越少,双讲时理想值为0.5~0.9(取决于回声信号在该帧的占比)。

​ cohxe:越接近1说明输出与远端参考信号越相似,越接近0说明两者差异越大,即残留的远端参考信号频谱成分越少,双讲时理想值为0。

​ SuppFactor:越接近1说明输出与麦克风信号的能量越接近,越接近0说明AEC造成能量衰落越严重,双讲时理想值为1。

  • 1
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
Yolov5的评判指标主要包括平均绝对误差(Mean Absolute Error,MAE)、平均百分比误差(Mean Absolute Percentage Error,MAPE)、IOU(Intersection over Union)、mAP(mean Average Precision)和平均对数漏检率(log-average miss rate)。 其中,平均绝对误差(MAE)是衡量模型预测误差的常用指标,它表示预测值与真实值之间的平均绝对差异。然而,MAE的缺点是不能确定模型是高估还是低估,也对异常值不敏感。平均百分比误差(MAPE)则在一定程度上影响了每个误差范围。 IOU是一种衡量目标检测模型性能指标,它表示预测框与真实框之间的交集与并集的比例。IOU越高,说明预测结果与真实结果的重叠程度越高。 mAP是指在给定一组IOU阈值下,计算所有类别的平均精度,并将其平均起来得到的检测性能指标。最后,将所有IOU阈值下的mAP进行平均,就得到了最终的性能评价指标:mmAP。 平均对数漏检率是一种对目标检测模型性能的评估指标,它表示预测框与真实框之间的漏检率的对数平均值。 因此,Yolov5的评判指标包括MAE、MAPE、IOU、mAP和平均对数漏检率。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [深度学习评估指标之目标检测——(yolov5 可视化训练结果以及result.txt解析)](https://blog.csdn.net/qq_41627642/article/details/126578865)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

王小二_Leon

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值