starganvc2变声器项目实战及其源码解读

1.数据与项目文件解读

        数据文件目录如下所示,需要注意的是,我们并不能直接对声音进行建模,而需要对声音数据进行预处理,从而得到一系列数值特征,然后对特征进行建模,特征数据存储到processed文件夹中 

        

2.环境配置

        pip install librosa

librosa主要负责声音数据的预处理

 pip install pysptk

有些环境需要C环境,需要安装visual studio

pip install pyworld

3.数据预处理与声音特征提取

运行preprocess.py,指定参数--dataset VCC2016

(1)声音信号的预处理

  • 首先,进行16KHZ重采样,即每秒采用16k次
  • 然后,进行预加重,通过来说,高频信号价值更大,于是我们补偿高频信号,让高频信号权重更大一些       
  • 分帧,类似时间窗口,得到多个特征段 

代码实现:使用librosa进行读取

def load_wavs(dataset: str, sr):
    """
        `data`: contains all audios file path. 
        `resdict`: contains all wav files.   
  • 15
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
OpenGL图形编程项目实战源代码的实现步骤如下: 1. 首先,我们需要按照OpenGL库的安装指南在计算机上安装OpenGL库,并确保安装的版本与所需的项目版本相符。 2. 然后,我们需要创建一个新的项目文件夹来存储我们的源代码和相关文件。 3. 接下来,我们可以使用C++或其他适合的编程语言来编写源代码。我们可以使用OpenGL的函数来创建窗口、设置渲染环境、加载和绘制图形等。 4. 在源代码中,我们可以定义各种图形对象,如三角形、矩形、球体等,并使用OpenGL的函数来设置它们的位置、颜色、纹理等属性。 5. 我们还可以在源代码中使用OpenGL的转换函数来实现图形的移动、旋转和缩放等操作。 6. 在代码中,我们需要使用OpenGL提供的函数来处理用户输入,例如键盘和鼠标事件,以便与图形对象交互。 7. 在最后,我们需要使用OpenGL的函数来实现渲染循环,以便在窗口中不断更新和渲染图形对象,以实现动态效果。 除了源代码之外,我们还可以在项目中添加着色代码、纹理文件和其他相关资源文件,以完善图形效果。 综上所述,OpenGL图形编程项目实战源代码的编写需要熟悉OpenGL库的使用和相关编程语言,以实现图形对象的创建、属性设置、交互以及渲染循环等功能。通过编写源代码,并辅以合适的资源文件,可以实现各种有趣的图形效果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

樱花的浪漫

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值