soundfile & torchaudio 读取音频文件

半截木头渡海洋

已于 2023-07-16 04:28:00 修改

阅读量1.2k

点赞数

分类专栏： pytorch 机器学习文章标签：音频文件 torchaudio soundfile

于 2023-07-16 03:48:57 首次发布

本文链接：https://blog.csdn.net/ljl86400/article/details/131746548

版权

机器学习同时被 2 个专栏收录

9 篇文章 0 订阅

订阅专栏

pytorch

4 篇文章 0 订阅

订阅专栏

soundfile 和 torchaudio 读取音频文件后的数据格式不同，前者是numpy，后者是tensor。前者读取后可以直接用于一些python的基础函数输入，后者用于pytorch的一些函数的应用。两者互换用途时候需要进行格式转换。

import soundfile as sf
import torchaudio
sound_file_3, sr = sf.read('./audio/bed_room_record_3.wav')
torch_audio_3, sr = torchaudio.load('./audio/bed_room_record_3.wav')

soundfile 读取音频文件后，数据格式为numpy.array ，数据是1维的，大小定义为 [ samples]

torchaudio 读取音频文件后，数据格式为 tensor ，数据是2维的，大小定义为 [ch , samples]

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

半截木头渡海洋

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
soundfile & torchaudio 读取音频文件

soundfile 和 torchaudio 读取音频文件后的数据格式不同，前者是numpy，后者是tensor。前者读取后可以直接用于一些python的基础函数输入，后者用于pytorch的一些函数的应用。两者互换用途时候需要进行格式转换。torchaudio 读取音频文件后，数据格式为 tensor ，数据是2维的，大小定义为 [ch , samples]soundfile 读取音频文件后，数据格式为numpy ，数据是2维的，大小定义为 [ch , samples]
复制链接

扫一扫