java 音色识别_Java实现Shazam声音识别算法的实例代码

本文介绍了如何使用Java实现Shazam声音识别算法。通过AudioSystem获取音频,运用傅里叶变换将时域信号转为频域信号,然后进行音频指纹的计算和匹配,从而识别音频。
摘要由CSDN通过智能技术生成

Shazam算法采用傅里叶变换将时域信号转换为频域信号,并获得音频指纹,最后匹配指纹契合度来识别音频。

1、AudioSystem获取音频

奈奎斯特-香农采样定理告诉我们,为了能捕获人类能听到的声音频率,我们的采样速率必须是人类听觉范围的两倍。人类能听到的声音频率范围大约在20Hz到20000Hz之间,所以在录制音频的时候采样率大多是44100Hz。这是大多数标准MPEG-1 的采样率。44100这个值最初来源于索尼,因为它可以允许音频在修改过的视频设备上以25帧(PAL)或者30帧( NTSC)每秒进行录制,而且也覆盖了专业录音设备的20000Hz带宽。所以当你在选择录音的频率时,选择44100Hz就好了。

定义音频格式:

public static float sampleRate = 44100;

public static int sampleSizeInBits = 16;

public static int channels = 2; // double

public static boolean signed = true; // Indicates whether the data is signed or unsigned

public static boolean bigEndian = true; // Indicates whether the audio data is stored in big-endian or little-endian order

public AudioFormat getFormat() {

return new AudioFormat(sampleRate, sampleSizeInBits, channels, signed,

bigEndian);

<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值