python语音库_利用python进行音频数据增强

ffd5b48b0e704dc3b39a55f913945139

在这篇文章中,我将向您展示如何使用音频文件的数据增强来构建一种在机器学习数据集中生成更多样本的方法。

数据增强是一种生成合成数据的方法,即通过调整原始样本来创建新样本。这也我们就可以从一个样本中获得大量的数据。这不仅有助于我们增加数据集的大小,还提供了单个样本的多个变体,这有助于我们的机器模型避免过度拟合。

我们将使用free-spoken-digit-dataset数据集(https://github.com/Jakobovski/free-spoken-digit-dataset)。它是语音数字的免费音频数据集。它包含4个人的2000录音(每个人每个数字读50遍)。

本文使用到的Python库为librosa、 IPython.display.audio 和 matplotlib库。

首先导入库

from fastai import *

from fastai.vision import *

import pathlib

import os

from scipy import signal

from scipy.io import wavfile

from fastprogress import progress_bar

import librosa

import librosa.display

import IPython.display as ipd

data_path = pathlib.Path('./free-spoken-digit-dataset/recordings/')

<
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值