【学习小记】零基础入门语音识别-Task2赛题数据介绍与分析

今天的内容有点不知道说啥=-=

赛题数据集

本次比赛的数据集来自Kaggle的“Eating Sound Collection”(可商用), 数据集中包含20种不同食物的咀嚼声音,赛题任务是给这些声音数据建模,准确分类。

数据探索

几方面收获:

波形幅度包络的查看:

plt.figure(figsize=(14, 5))
librosa.display.waveplot(data1,sr=sampling_rate1)

以及声谱图(声音或其他的频率随时间变化的表示)的查看:

plt.figure(figsize=(20, 10))
D = librosa.amplitude_to_db(np.abs(librosa.stft(data1)), ref=np.max)
plt.subplot(4, 2, 1)
librosa.display.specshow(D, y_axis='linear')
plt.colorbar(format='%+2.0f dB')
plt.title('Linear-frequency power spectrogram of aloe')

以及除了librosa之外,今天又认识了一个库哈哈哈哈,IPython.display.Audio: 该模块能使得音频直接在jupyter笔记本中播放。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值