做一个纯粹的人-CSDN博客

原创 numpy数组转为二进制

##查看.bin 文件里的二进制转化为整数时是否能和原数据对应，将原数据先保存到.txt文件中#data是一个数组#将tensor数据转为numpy ，以二进制方式读入保存到.bin中data = data.cpu().numpy()data.tofile('b.bin')#将data数据保存到.txt中data = data.cpu().numpy()np.savetxt('002.txt',data,fmt='%d',delimiter=',')#将b.bin文件转为对应的原始数据的格

2022-01-11 11:32:44 6081

原创有关tensor numpy 索引

###将tensor 转为numpytargets_to_np = targets.detach().cpu().numpy()x = torch.tensor([1,2,3,2,5,6,5,2])x#tensor([1, 2, 3, 2, 5, 6, 5, 2])x1 = x.detach().cpu().numpy()x1 #array([1, 2, 3, 2, 5, 6, 5, 2])###将numpy 转为 tensortargets_index_totensor =torch.te

2021-12-24 17:33:54 861

原创音频拼接。

##将一段音频拼接到另一段音频音量较高的地方from posixpath import joinimport numpy as npimport osimport librosaimport soundfile as sfout_path = ''s_parh = ''n_path = ''ss_path = [os.path.join(n_path,name) for name in os.listdir(n_path)]filelist = os.listdir(s_parh)

2021-12-18 12:12:04 217

原创图片风格迁移

##将图片进行风格迁移，将第一幅图片的均值平均差换成第二幅图的均值平方差。第三张是生成的图片from numpy.lib.type_check import _imag_dispatcherfrom builtins import printfrom os import preadimport sysfrom PIL import Image,ImageStatimport numpy as npimport matplotlib.image as mapingimport osimgs

2021-12-14 15:41:28 3185 1

原创合并多个音频

##将多个音频文件合并import librosaimport randomimport numpy as npimport osfrom pydub import AudioSegmentout_path = "yan"file_path = "yang"ff = 0out = os.path.join(out_path , 'zonghe.wav')filelist = os.listdir(file_path)for file in filelist: path =

2021-12-14 15:29:55 3053

原创 python 数据量化

##音频数据量化：r :浮点实数q：量化后的定点整数r = s(q-z)q = round(r/s+z)s = (rmax-rmin)/(qmax-qmin)z = round(qmax - rmax/s)例如我们对音频取完mel，得到mel，这时我们对其取log进行限幅，例如限幅度在-3至3之间或者对其取均值除方差操作，总之让其归一化到一段区间，之后对其量化8比特-（0-255）最后再将其反量化回去。 r_min = -3 r_max = 3 q_max =255 q_min = 0

2021-12-10 19:06:26 2523

原创索引数组序号

###索引某一列数组序号import numpy as npa = np.arange(10).reshape(5,2)x = a[:,0:1]b =[]for i in x: b.append(i)d= np.concatenate(b)for j in range(len(d)): if d[j] > 2: print(j)```

2021-12-08 14:44:03 134

原创音频拼接python

音频拼接

2021-12-08 11:05:45 2434

原创筛选文件夹

筛选文件

2021-12-07 19:36:35 169

原创转换音频格式

##音频将.pcm转换成.wavimport waveimport osdef pcm2wav(pcm_file, wav_file, channels=1, bits=16, sample_rate=16000): # 打开 PCM 文件 pcmf = open(pcm_file, 'rb') pcmdata = pcmf.read() pcmf.close() # 打开将要写入的 WAVE 文件 wavfile = wave.open(wa

2021-11-26 17:38:53 102

原创随机抽取文件

##将制定文件夹下的文件随机挑出n个，放在另一个文件夹下import randomimport osfrom shutil import copyfileimgs = []for x in os.listdir(file_path): if x.endswith('.wav'): imgs.append(x)selected_imgs=random.sample(imgs,k=5)print(selected_imgs)for img in selec

2021-11-25 17:18:53 354

原创音频裁剪重新组合

##将一段音频分割成几段，将这几段打乱顺序，然后重新组成音频。import librosaimport randomimport numpy as npimport osimport torchimport soundfile as sffilelist = os.listdir(file_path)for i in range(len(filelist)): path = file_path +'/'+filelist[i] out = out_path+'/'

2021-11-24 15:23:57 2264

原创查看音频音量

##查看文件夹下音频的音量，大于-10db的进行保存，排序所有音量大小from pydub import AudioSegmentimport ospath = 'speech_commands/xiaojun'out = 'ss'files = os.listdir(path)vol = []for dir in files: file = os.path.join(path,dir) sound = AudioSegment.from_file(file) db =

2021-11-23 11:43:53 2199

原创通过信噪比更改增益

将音量进行调整，调整为原来的α倍，已知增强后的语音能量dwaveform, sr = torchaudio.load(file_path)rand_dbfs = np.random.uniform(20,30)ref = torch.sqrt(torch.tensor(waveform.shape[0]))#将其音量都变为1current_dbfs = 20 * torch.log10(torch.norm(waveform)/ ref)gain_db = rand_dbfs - current

2021-11-22 20:04:29 1585

原创 2021-11-03

##将批量音频文件 .ogg文件转换成.wav.或是其他音频文件转换成.wavfrom librosa.util.exceptions import LibrosaErrorfrom pydub import AudioSegmentfrom pydub.utils import make_chunksfrom pydub.silence import detect_silenceimport osimport librosaimport randomimport numpy as np

2021-11-03 16:48:47 126

原创 2021-11-01

将大于2.5s的音频进行随机裁剪，按不同时长进行多段裁剪，一段音频最多裁剪5次。from librosa.util.exceptions import LibrosaErrorfrom pydub import AudioSegmentfrom pydub.utils import make_chunksfrom pydub.silence import detect_silenceimport osimport librosaimport randomimport numpy as np

2021-11-01 15:18:24 837

原创 2021-10-29

将文件夹里的音频进行筛选，将音频大于5秒的随机裁剪2秒保存from librosa.util.exceptions import LibrosaErrorfrom pydub import AudioSegmentfrom pydub.utils import make_chunksfrom pydub.silence import detect_silenceimport osimport librosaimport randomimport numpy as npout_path =

2021-10-29 14:37:12 101

做一个纯粹的人