PyTorch for Audio + Music Processing(1) :Course Overview(课程大纲)

4 篇文章 0 订阅
4 篇文章 0 订阅

Course Overview(课程大纲)


前言

作者Valerio Velardo在youtube的频道 The Sound of AI发布了PyTorch for Audio + Music Processing系列的教程,适合快速入门如何使用pytorch处理音频和音乐,课程中从处理音频数据、构建数据集和dataloader,到构建一个简单的分类器并完成训练和预测,都有比较详细的讲解

一、torchaudio是什么?

● Audio processing library for PyTorch
torch的语音处理库
● I/O functionalities
i/o处理
● Audio datasets
语音数据库
● Data augmentation
数据增强
● Feature extraction
特征提取

二、通过此课程能掌握到的技能

● Overview of PyTorch and torchaudio :torchaudio 总体掌握
● Build, train, evaluate DL models in PyTorch:训练,验证深度学习模型
● Make inference with PyTorch models :实现接口
● Load audio datasets with custom PyTorch datasets:加载语音数据库和客制化数据库
● Perform audio feature extraction on GPU using torchaudio:使用torchaudio做语音特征提取
● Use CNN models for sound classification:使用CNN模型对语音进行分类

三、实现的内容

● Multiclass classification problem:多分类问题
● UrbanSound8k dataset:城市声音数据集
● 10 sound classes:10个类别的语音分类任务
案例结构:
在这里插入图片描述

四、前置条件

● Intermediate Python :Python基础
● Advisable:
○ Basic understanding of audio features (Mel spectrograms)
基础乐理
○ Familiar with Deep Learning (CNN architectures)
深度学习原理

资源

github地址
youtube播放地址
bilibili播放地址

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值