基于内容的音频场景分割

如需转载,请注明出处!


从音频场景分割的复杂度上来讲,最有难度的为 speech+song VS song 之间的分割。

speech+song: 前景为人说话,背景为singing song

speech+song  VS song  而且的基本构成都可视为  speech+instrument,场景很为相似,所以在分割上增加很大难度。


下表为实验结果:


1:music  0:speech


21.952000, 0 -> 1
25.632000, 1 -> 0
54.400000, 0 -> 1
59.488000, 1 -> 0
114.848000, 0 -> 1
121.984000, 1 -> 0
167.456000, 0 -> 1
173.216000, 1 -> 0
197.568000, 0 -> 1
202.912000, 1 -> 0
229.728000, 0 -> 1
233.024000, 1 -> 0
256.384000, 0 -> 1
263.200000, 1 -> 0
308.000000, 0 -> 1
315.712000, 1 -> 0
332.480000, 0 -> 1
336.160000, 1 -> 0
360.512000, 0 -> 1
368.640000, 1 -> 0
397.184000, 0 -> 1
399.584000, 1 -> 0
404.928000, 0 -> 1
408.000000, 1 -> 0
441.984000, 0 -> 1
450.688000, 1 -> 0
468.608000, 0 -> 1
475.232000, 1 -> 0
506.112000, 0 -> 1
511.008000, 1 -> 0
544.608000, 0 -> 1
546.496000, 1 -> 0
548.480000, 0 -> 1
552.000000, 1 -> 0
592.288000, 0 -> 1
601.504000, 1 -> 0
653.472000, 0 -> 1
660.032000, 1 -> 0



文件地址:

http://pan.baidu.com/s/1sjzfVE9

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值