2021-11-03

最新推荐文章于 2024-09-09 00:00:00 发布

做一个纯粹的人

最新推荐文章于 2024-09-09 00:00:00 发布

阅读量114

点赞数

分类专栏：实习ing 文章标签： python 语音识别

本文链接：https://blog.csdn.net/weixin_46178043/article/details/121124936

版权

实习ing 专栏收录该内容

17 篇文章 0 订阅

订阅专栏

##将批量音频文件 .ogg文件转换成.wav.或是其他音频文件转换成.wav

from librosa.util.exceptions import LibrosaError
from pydub import AudioSegment
from pydub.utils import make_chunks
from pydub.silence import detect_silence
import os
import librosa
import random
import numpy as np

out_path = "zhuan"
file_path = "./zyang/xiaojun"
ss = os.listdir(file_path)
file = []
for files in ss:
    # if files.endswith('.wav'or'.mp3'):
        file.append(files)
for i in range(len(ss)):
    
      sound = AudioSegment.from_file(file_path+'/'+file[i])
      
      sound.export(out_path+'/'+file[i].split('.')[0]+'.wav', format="wav")

##将音频文件重采样，将采样频率由48000->16000.

from logging import _srcfile
from librosa.util.exceptions import LibrosaError
from pydub import AudioSegment
from pydub.utils import make_chunks
from pydub.silence import detect_silence
import os
import librosa
import random
import numpy as np
import torchaudio

out_path = "./speech_commands/zhuan16"
file_path = "./speech_commands/zhuan"
ss = os.listdir(file_path)
file = []
for files in ss:
    # if files.endswith('.wav'or'.mp3'):
        file.append(files)
for i in range(len(ss)):

    waveform, sr = torchaudio.load(file_path+'/'+file[i])
    waveform = torchaudio.transforms.Resample(orig_freq=48000, new_freq=16000)(waveform)

    torchaudio.save(out_path+'/'+file[i], waveform, sample_rate=16000)

做一个纯粹的人

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
2021-11-03

##将批量音频文件 .ogg文件转换成.wav.或是其他音频文件转换成.wavfrom librosa.util.exceptions import LibrosaErrorfrom pydub import AudioSegmentfrom pydub.utils import make_chunksfrom pydub.silence import detect_silenceimport osimport librosaimport randomimport numpy as np
复制链接

扫一扫