语音
文章平均质量分 70
KKK_KAWAKO
本平台停止更新,后续文章将在个人博客发布
展开
-
【KAWAKO】speechmetrics-语音方面评价指标库的安装与使用
目录简介安装将工程以压缩包形式下载到本地把压缩包传到服务器(你想部署的地方)上进行解压用编辑器打开setup.py进行修改在工程目录下进行安装测试简介speechmetrics库提供了对语音质量进行评估的各种指标,包括MOSNet、BSSEval、STOI、PESQ、SRMR、SISDR等,方便我们对模型进行快速评估。github链接在这里。安装由于【pip install git+http://......】会出现一些问题,再加上国内的种♂种♂原♂因,用sp原创 2022-01-06 11:43:28 · 3064 阅读 · 5 评论 -
【KAWAKO】DTLN-1Dconv的原理
DTLN的结构如图。第一部分是在stft得到的频谱上进行降噪处理,属于频域处理。第二部分是在1D卷积得到的特征上进行进一步降噪处理,也属于频域处理。其源码如下。两个1D卷积已用红框标出。可以注意到,两个1D卷积的参数如下:第一个1D卷积,输入维度为1*1*512(32ms),卷积核的大小为1*1、个数为encoder_size=256。第二个1D卷积,输入维度为1*1*256,卷积核的大小为1*1、个数为blocklen=512。怎么理解DTLN的第二部分呢第一部分.原创 2021-08-23 18:02:38 · 1631 阅读 · 11 评论 -
【KAWAKO】soundtoch-使用可执行文件对音频进行变调或变速
下载从官网下载可执行文件。单次使用在终端中直接运行,会出现使用方法和可选参数。变速就设置tempo,变调就设置pitch,都变就都设置。使用python脚本批量处理原创 2021-08-11 14:01:02 · 259 阅读 · 0 评论 -
【KAWAKO】audiotsm-使用python对音频进行变速不变调处理
目录安装库导入相关库定义reader定义writer定义WSLOA算法,并运行官方手册源码安装库pip install audiotsm导入相关库import audiotsmimport audiotsm.io.wavimport audiotsm.io.array定义reader# 可以直接读取文件reader = audiotsm.io.wav.WavReader("qaq.wav")'''# 也可以加载别的地方传过来的numpy.n原创 2021-08-11 09:59:06 · 860 阅读 · 1 评论 -
【KAWAKO】Pydub-某些函数的使用方法
目录EQ源码其中使用的_eq函数源码测试代码EQ源码seg:AudioSegment音频 focus_freq:需要调整的中心频率 bandwidth:调整的频率范围 channel_mode:调整哪个声道 filter_mode::滤波器种类。“peak”带通,“low_shelf”对低频做处理,“high_shelf”对高频做处理 gain_dB:处理的增益大小 order:暂时没看懂什么意思,保持默认的2就好其中使用的_eq函数源码测试代码抑制原创 2021-08-10 10:29:39 · 193 阅读 · 0 评论 -
【KAWAKO】RNNoise-将模型做成接口并交叉编译到RK3308上
目录做成接口交叉编译编译出动态链接库使用编译出的动态链接库进行推理做成接口RNNoise已经将推理过程整理成了一个函数(src/denoise.c中的rnnoise_process_frame函数),我们只需要写一个类,其中包含2~3个方法(构造函数、推理函数、析构函数)即可。比如我们创建rnnoise_inference.cpp与rnnoise_inference.h文件,构建Rnnoise类,其中包含一个构造函数和一个推理函数:rnnoise_inference.h..原创 2021-08-04 16:38:31 · 510 阅读 · 0 评论