python pytorch语音识别_PyTorch通过ASR实现语音到文本端的模型以及pytorch语音识别(speech) - pytorch中文网...

ASR,英文的全称是Automated Speech Recognition,即自动语音识别技术,它是一种将人的语音转换为文本的技术。今天我们主要了解pytorch实现语音到文本的端到端模型。

speech

speech是一个开源软件包,用于构建自动语音识别的端到端模型。目前支持具有注意力和连接主义时间分类的序列 - 序列模型。

这个软件的目标是促进语音识别端到端模型的研究。这些模型在PyTorch中实现。

该软件仅在Python2.7中测试过,但我们打算同时支持2.7和3.5。

安装

我们建议创建一个虚拟环境并在那里安装python需求。

virtualenv

source /bin/activate

pip install -r requirements.txt

然后按照适用于您的机器的PyTorch版本的安装说明进行操作 。

在安装了所有python需求之后,从顶层目录运行:

make

构建过程需要CMake以及Make。

之后,setup.sh从源码安装。

source setup.sh

考虑把这个添加到你的bashrc。

您可以通过运行tests目录中的测试来验证安装是否成功。

cd tests

pytest

运行

训练模型运行

python train.py

模型完成训练后,您可以使用

python eval.py

要查看每个脚本使用的可用选项-h:

python {train, eval}.py -h

例子

有关模型配置和数据集的示例,请访问示例目录。每个示例数据集应具有用于下载和准备数据的指令和/或脚本。还应该有一个或多个模型配置可用。每个配置的结果将记录在每个对应的例子中README.md。

姓名地址:Github

原创文章,转载请注明 :PyTorch通过ASR实现语音到文本端的模型以及pytorch语音识别(speech) - pytorch中文网

原文出处: https://ptorch.com/news/81.html

问题交流群 :168117787

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值