高潮挑歌:自动剪辑出流行歌曲的副歌(高潮)部分

这应该是我在2016年6月份完成的一个小项目。

在这个信息爆炸的时代,数据压缩和信息检索早已成为一项非常重要的工作。文本的压缩和检索已经具备非常成熟的技术了,而音频等多媒体信息检索方面还有待进一步的研究。一方面可以是数据量的压缩,比如想办法把数据从10 MB压缩到3 MB。另一方面是对内容方面的剪辑,比方说从一首4分钟的歌里面提取出30秒作为它“最具表现力”的部分,而这种“最具表现力”的部分,通常指的就是一首歌曲的“副歌”部分,即歌曲的高潮部分,因为副歌往往是大家朗朗上口的片段。如果能从一首歌曲中截取出它的副歌部分,听众在很短的时间内,就可以从直观上,从感官上对这首歌作出一些评价。应用场景可以是在具有版权保护的音乐公司给听众一段试听的曲目,或是让听众在KTV中直接选择歌唱副歌的部分,也可以是让听众在段时间内挑出符合他自己口味的歌曲。

本项目利用信号处理、时频分析、特征提取、图像卷积等技术,实现了从一首流行歌曲中,挑选出它的副歌部分的功能。

思想是,副歌部分的旋律会重复,如果能找到重复的旋律,基本上就找到了歌曲的副歌部分。

具体流程是,对一维的音频信号进行短时傅里叶变换,得到时频分析的二维矩阵,通过计算每帧与其他帧的相似程度,构造一个自相似矩阵。再利用图像处理的卷积运算,对该自相似矩阵做线条检测,最终确定出副歌的位置。

左图:自相似矩阵;右图:线条检测的结果。

框出来的地方,就是最相思的地方。

可以看到,这首歌曲的第500帧~第800帧,与它的第100帧与第400帧很相似。

可以认为,这是该歌曲的副歌部分。

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 8
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

qcyfred

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值