torchaudio load URL下载（内存中bytes类型）的音频

最新推荐文章于 2024-12-11 18:22:45 发布

warpin

最新推荐文章于 2024-12-11 18:22:45 发布

阅读量3.8k

点赞数

分类专栏： DL框架文章标签： python 深度学习语音识别

本文链接：https://blog.csdn.net/lhp171302512/article/details/121492911

版权

python读本地音频文件（转换成数组）的方式有很多，wave、scipy、librosa、torchaudio等。可有时候音频不在本地，而是从互联网传过来的，当然可以先保存到本地再读，但这样会多了硬盘读写的过程，数据下载下来本就经过内存，能不能直接取出来呢？

去度娘找了一遍没找到答案，便自己摸索了一下，被瞎猫撞到了死耗子，好像可以，用的是torchaudio.load()，先上代码。

import torchaudio
import requests
from io import BytesIO

url = "https://downsc.chinaz.net/Files/DownLoad/sound1/202111/14994.wav"	# 音频的URL
req = requests.get(url)		# 下载音频
bt

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

warpin

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
4
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Pytorch使用手册-音频 I/O（专题十八）

探索人工智能革命，深入算法原理与创新应用，未来科技无限可能。

02-23

201

本教程展示了如何使用TorchAudio的基本输入/输出（I/O）API来检查音频数据，将其加载到PyTorch张量中，并保存PyTorch张量。在最近的版本中，音频输入/输出进行了多个计划或已实施的更改。有关这些更改的详细信息，请参考“Dispatcher 介绍”。输出。

CosyVoice 语音合成TTS、声音克隆自定义api服务搭建；requests请求使用

weixin_42357472的博客

07-10

4473

参考：https://blog.csdn.net/weixin_42357472/article/details/140213547。

4 条评论您还未登录，请先登录后发表或查看评论

torchaudio-0.8.1-cp37-none-win_amd64.whl

04-26

torchaudio-0.8.1-cp37-none-win_amd64 .whl 版本对应的可以下载下来然后安装。可以在官网https://download.pytorch.org/whl/torch_stable.html中下载。

torch torchvision torchaudio下载网址

qq_53821866的博客

10-19

364

download.pytorch.org/whl/torch_stable.html

Torchaudio 和 Torchvision 资源文件下载

gitblog_09730的博客

10-15

509

Torchaudio 和 Torchvision 资源文件下载【下载地址】Torchaudio和Torchvision资源文件下载 Torchaudio 和 Torchvision 资源文件下载项目地址: https://gi...

Linux系统torch、torchversion、torchaudio 文件下载地址

m0_57143158的博客

03-03

1054

whl文件下载：torch、torchversion、torchaudio下载地址:torchversion、torchaudio下载地址：

pytorch深度学习入门（5）之-Torchaudio音频加载

ajunbin859的专栏

11-10

7698

Torchaudio是一个用于处理音频数据的Python库，它是基于PyTorch的扩展库，提供了丰富的音频处理功能和一系列预处理方法，方便用户在音频领域进行机器学习和深度学习的研究。具体来说，Torchaudio提供了从音频文件的读取到加载，音频变换和增强，以及音频数据可视化的整套工具。此外，Torchaudio还集成了一些常见的音频数据集，方便用户快速获取和处理音频数据。在安装方面，首先需要安装PyTorch，可以通过pip install torch命令来安装最新版本。

F5-TTS文本语音合成模型的使用和接口封装，tts合成音频，http流式输出，音频采样率转换

最新发布

m0_46168848的博客

12-11

7037

2024年10月8日，上海交通大学团队发布，F5-TTS (A Fairytaler that Fakes Fluent and Faithful Speech with Flow Matching) 是一款基于扩散Transformer和ConvNeXt V2的文本转语音 (TTS) 模型。F5-TTS旨在生成流畅且忠实的语音，其训练速度和推理速度都得到了提升。项目还提供了一个名为E2 TTS的模型，它是论文中模型的更接近的复现版本，基于Flat-UNet Transformer。

Nvidia 系列之在 Ubuntu 22.04 中为 LLM 设置 Nvidia GPU

iCloudEnd的博客

08-01

390

在开始安装之前，我们先来了解一下要安装的内容：Nvidia 驱动程序 — 这是 Nvidia 的硬件驱动程序。安装前请先了解您的显卡型号。CUDA 工具包 — CUDA 工具包由 Nvidia 提供。它包含 GPU 加速环境中的库、编译器、开发工具和示例、CUDA 运行时等。cuDNN — Nvidia cuDNN 以 CUDA 深度神经网络为基础。它是一个针对 DNN 计算的高度优化的 GPU 加速库。

离线下载的pytorch/torchvision/torchaudio

m0_46275263的博客

03-10

1538

下载pytorch-torchvision-torchaudio等一系列一定要版本匹配，并且如果是在gpu上跑的话，一定要都是cu版本。对应的python3.9，nvcc -V出来的是cuda12.0，只能向下兼容，所以对应的是11.8版本。最后出来的视频效果比较差，很卡顿，并且识别效果也较差。然后先下载上面的离线版本，版本一定要匹配，去官网看。

torchaudio-0.10.0+cu113-cp36-cp36m-win_amd64.whl

07-17

torchaudio软件包，直接下载下来，通过命令窗口输入：pip install torchaudio-xxx.whl安装就行，再也不怕pip安装timeout了

torchaudio-0.12.0-cp38-cp38-manylinux2014_aarch64.whl

07-17

torchaudio软件包，直接下载下来，通过命令窗口输入：pip install torchaudio-xxx.whl安装就行，再也不怕pip安装timeout了

torchaudio-0.12.1-cp38-cp38-macosx_11_0_arm64.whl

07-17

torchaudio软件包，直接下载下来，通过命令窗口输入：pip install torchaudio-xxx.whl安装就行，再也不怕pip安装timeout了

python+torchaudio加载音频数据源

12-23

用idea写的通过torchaudio,soundfile加载wav音频文件并展示音频信号图

torch、torchversion、torchaudio 轮子whl文件下载地址

sept_boy的博客

07-31

1035

torch、torchversion、torchaudio 轮子whl文件下载地址。

Arican_的博客

04-05

3507

为了避免在Win10系统中直接使用pip而遇到网络不稳定的问题，就如read out time,我们使用手动下载whl文件再使用pip的方法来安装PyTorch。 whl是wheel的简称，是一个包括特定格式的ZIP格式文件，是各种Python发行工具包的标准。 1.下载whl文件进入PyTorch官网下载，按照正常的操作来选择命令。按照图内操作，右键框选中此网站并跳转过去选择下载即可，下载好的whl文件如何安装到自己的虚拟环境中，请看上上回。 ...

windows安装torchaudio

Autismdj的博客

03-03

2288

Pytorch已经提供了windows版本的官方Torchaudio 以下是下载torchaudio的链接 https://download.pytorch.org/whl/torch_stable.html 如图，找到自己需要的版本下载安装即可

下载与cuda版本对应的pytorch、torchvision、torchaudio

weixin_46455141的博客

06-30

3714

下载与cuda版本对应的pytorch、torchvision、torchaudio

torchaudio的使用