音乐指纹识别
go2coding
关注机器学习,人工智能
展开
-
音乐指纹识别(三):波形特征
对主流的音频格式进行解析以后,绘制出了声音的波形。一段音频的特征,需要在这段波形中寻找。在这里,会用到一些基础的数学知识,在文中只是简略的用文字进行原理的说明。在数学中有提到,任何周期函数都可以用正弦函数和余弦函数构成的无穷级数来表示。这段话如果用不太严谨语言,可以这样来理解,对一段的曲线来说,我们都可以用一组正弦曲线和余弦曲线叠加而成。这样一来,曲线就分解为一个一个正弦曲线和余弦曲线的叠加,只要知道主要的正弦和余弦曲线,就能够来表示这一段曲线的特征。那正弦和余弦我们这么能够来表示曲线的特征呢?在正弦原创 2022-04-09 08:42:10 · 3010 阅读 · 0 评论 -
音乐指纹识别(二):处理mp3音乐波形
之前已经处理完了wav文件的解析,在网络中经常出现的音频文件并不是wav文件,而是mp3文件。对于mp3文件的解析,直接使用pydub库。安装 pydub 的方法:pip install pydubmp3格式是对音频的一种压缩方式,当解开音频后可以得到跟wav一样对声音描述的数据。filename = 'mp3\\Choc--Eigenvalue-Subspace-Decomposition.mp3'audiofile = AudioSegment.from_file(filename)da原创 2022-04-09 08:39:59 · 2972 阅读 · 0 评论 -
音乐指纹识别(四):提取特征进行识别
理论的基础有了接下来就是应用到具体的情况中,现在先通过对wav音频进行短时傅里叶变换,看看能得到什么样的图形。#!/usr/bin/python#coding=utf-8import numpy as npdef calc_stft(signal, sample_rate=16000, frame_size=0.025, frame_stride=0.01, winfunc=np.hamming, NFFT=512): # Calculate the number of frames原创 2022-04-09 08:44:17 · 945 阅读 · 0 评论 -
音乐指纹识别(一):音乐波形
现在大部分的手机音乐客户端中如,网易音乐,qq音乐中都有一个功能,可以通过听取一段音乐来识别这是哪一首歌曲。最早开始有这个功能是在Shazam中看见的,现在关于如何识别音乐也有较多的资料,这里通过一些简要的分析来说明听音识别歌曲是如何实现的。我们需要对计算机中的声音进行研究,获取一种能够代表这首歌曲的唯一标识,这就是我们通常说的音乐指纹。在把音乐进行数字化后,以最原始的wav为例,计算机是使用一串数字来代表音乐的,通常来说,我们以一定的频率(44100Hz)对声音进行采样,存入文件时,以两个频道的格式进行原创 2022-04-09 08:38:58 · 785 阅读 · 0 评论