Java实现Shazam声音识别算法

最新推荐文章于 2024-05-15 11:53:06 发布

llhhzz1989

最新推荐文章于 2024-05-15 11:53:06 发布

阅读量4.7k

点赞数 3

文章标签： Java

本文链接：https://blog.csdn.net/llhhzz1989/article/details/82585957

版权

Java实现Shazam声音识别算法

Shazam算法采用傅里叶变换将时域信号转换为频域信号，并获得音频指纹，最后匹配指纹契合度来识别音频。

1、AudioSystem获取音频

奈奎斯特-香农采样定理告诉我们，为了能捕获人类能听到的声音频率，我们的采样速率必须是人类听觉范围的两倍。人类能听到的声音频率范围大约在20Hz到20000Hz之间，所以在录制音频的时候采样率大多是44100Hz。这是大多数标准MPEG-1 的采样率。44100这个值最初来源于索尼，因为它可以允许音频在修改过的视频设备上以25帧（PAL）或者30帧（ NTSC）每秒进行录制，而且也覆盖了专业录音设备的20000Hz带宽。所以当你在选择录音的频率时，选择44100Hz就好了。
定义音频格式：

    public static float sampleRate = 44100;
    public static int sampleSizeInBits = 16;
    public static int channels = 2; // double
    public static boolean signed = true; // Indicates whether the data is signed or unsigned
    public static boolean bigEndian = true; // Indicates whether the audio

最低0.47元/天解锁文章

llhhzz1989

关注

3
点赞
踩
30

收藏

觉得还不错? 一键收藏
5
评论
Java实现Shazam声音识别算法

Java实现Shazam声音识别算法Shazam算法采用傅里叶变换将时域信号转换为频域信号，并获得音频指纹，最后匹配指纹契合度来识别音频。1、AudioSystem获取音频奈奎斯特-香农采样定理告诉我们，为了能捕获人类能听到的声音频率，我们的采样速率必须是人类听觉范围的两倍。人类能听到的声音频率范围大约在20Hz到20000Hz之间，所以在录制音频的时候采样率大多是44100Hz。...
复制链接

扫一扫