Helsinki Prosody 项目教程

最新推荐文章于 2024-12-28 09:29:33 发布

孔朦煦

最新推荐文章于 2024-12-28 09:29:33 发布

阅读量870

点赞数 12

本文链接：https://blog.csdn.net/gitblog_00849/article/details/142505424

版权

Helsinki Prosody 项目教程

prosody Helsinki Prosody Corpus and A System for Predicting Prosodic Prominence from Text 项目地址: https://gitcode.com/gh_mirrors/pro/prosody

1. 项目介绍

Helsinki Prosody 项目是一个专注于从文本中预测韵律重音（prosodic prominence）的开源项目。该项目由赫尔辛基大学自然语言处理实验室（Helsinki-NLP）开发，旨在提供一个大规模的英语韵律标注数据集，并开发相应的模型来预测文本中的韵律特征。

主要特点：

数据集：包含最大的英语韵律标注数据集，基于 LibriTTS 语料库。
模型：提供基于 BERT 和 BiLSTM 的模型，用于从文本中预测韵律重音。
开源：代码和数据集均公开，便于研究人员和开发者使用和扩展。

2. 项目快速启动

2.1 环境准备

首先，确保你已经安装了以下依赖：

Python 3
PyTorch >= 1.0
argparse
pytorch_transformers
numpy

你可以通过以下命令安装这些依赖：

pip3 install -r requirements.txt

2.2 下载数据集

克隆项目仓库并下载数据集：

git clone https://github.com/Helsinki-NLP/prosody.git
cd prosody

2.3 训练模型

2.3.1 训练 BERT 模型

运行以下命令来训练 BERT 模型：

python3 main.py \
  --model BertUncased \
  --train_set train_360 \
  --batch_size 32 \
  --epochs 2 \
  --save_path results_bert.txt \
  --log_every 50 \
  --learning_rate 0.00005 \
  --weight_decay 0 \
  --gpu 0 \
  --fraction_of_train_data 1 \
  --optimizer adam \
  --seed 1234

2.3.2 训练 BiLSTM 模型

运行以下命令来训练 BiLSTM 模型：

python3 main.py \
  --model BiLSTM \
  --train_set train_360 \
  --layers 3 \
  --hidden_dim 600 \
  --batch_size 64 \
  --epochs 5 \
  --save_path results_bilstm.txt \
  --log_every 50 \
  --learning_rate 0.001 \
  --weight_decay 0 \
  --gpu 0 \
  --fraction_of_train_data 1 \
  --optimizer adam \
  --seed 1234