PENN项目使用教程

最新推荐文章于 2024-09-03 09:31:47 发布

柳旖岭

最新推荐文章于 2024-09-03 09:31:47 发布

阅读量390

点赞数 5

本文链接：https://blog.csdn.net/gitblog_00008/article/details/139555653

版权

PENN项目使用教程

penn Pitch Estimating Neural Networks (PENN) 项目地址: https://gitcode.com/gh_mirrors/pe/penn

1、项目介绍

PENN（Pitch Estimating Neural Networks）是一个用于音高估计的神经网络项目，由interactiveaudiolab开发。该项目基于PyTorch框架，旨在提供高效、准确的音高和周期性估计。PENN不仅支持预训练模型的推理，还提供了训练和评估自定义模型的功能。

2、项目快速启动

安装

要使用预训练的FCNF0++模型进行音高估计，请运行以下命令：

pip install penn

如果你想训练或使用自己的模型，请运行：

pip install penn[train]

推理示例

以下是一个使用预训练模型进行音高估计的示例代码：

import penn
import torchaudio

# 加载音频
audio, sample_rate = torchaudio.load('test/assets/gershwin.wav')

# 设置跳跃大小为10毫秒
hopsize = 0.01

# 设置频率范围
fmin = 30
fmax = 1000

# 选择GPU进行推理，设置为None则使用CPU
gpu = 0

# 设置批处理大小
batch_size = 2048

# 选择检查点，设置为None将下载并使用预训练的FCNF0++模型
checkpoint = None

# 设置帧中心
center = 'half-hop'

# 设置未发声区域的线性插值阈值
interp_unvoiced_at = 0.65

# 进行音高和周期性估计
pitch, periodicity = penn.from_audio(
    audio, sample_rate, hopsize=hopsize, fmin=fmin, fmax=fmax,
    checkpoint=checkpoint, batch_size=batch_size, center=center,
    interp_unvoiced_at=interp_unvoiced_at, gpu=gpu
)