王小稳
摘 要:本文介绍了一种基于计算多个音频信号物理特征值相关系数的音频内容比对算法。利用两路音频的时域帧序列、短时过零率序列、谱质心序列和梅尔倒频系数序列,再将这四组参数进行相关性统计,计算出它们的相关性函数,获得最大相关性系数。从而判断两路音频是否内容一致的音频比对算法。是信号处理领域,更进一步涉及音频信号处理领域中的一种基于相似度的音频比对方法。
关键词:音频内容比对 音频比对算法 时域相关系数 过零率相关系数 梅尔倒频系数 谱质心相关系数
中图分类号:TN912.3 文献标识码:A 文章编号:1674-098X(2020)02(a)-0141-02
语言是我们人类的重要交流工具,自然高效、方便准确。对于语音信号处理的研究最早可以追溯到1876年贝尔发明电话。把模拟音频信号转换成电信号,再将电信号转换成模拟信号完成电话的功能。对音频的处理在我们身边无处不在。与我们的生活息息相关。近年来在工作中接触到对音频内容的判别,实时、准确的判断传输链路上的音频内容是否一致,都要靠人工去判别,当播出节目是非汉语节目时,判别起来也是件很困难的事情。为了使我们的工作更简便,有效地减少人为播出事故,更迅速的发现播出音频的异常。为此我们早在十几年前,就研究了几种公开发表的关于音频比对的文章、算法和专利,以便学习研究出一种新的拥有自主知识产权的音频内容比对算法。