python pytorch语音识别_PyTorch通过ASR实现语音到文本端的模型以及pytorch语音识别(speech) - pytorch中文网...

最新推荐文章于 2024-08-19 09:57:26 发布

weixin_39593523

最新推荐文章于 2024-08-19 09:57:26 发布

阅读量1.7k

点赞数

文章标签： python pytorch语音识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39593523/article/details/111764399

版权

ASR，英文的全称是Automated Speech Recognition，即自动语音识别技术，它是一种将人的语音转换为文本的技术。今天我们主要了解pytorch实现语音到文本的端到端模型。

speech

speech是一个开源软件包，用于构建自动语音识别的端到端模型。目前支持具有注意力和连接主义时间分类的序列 - 序列模型。

这个软件的目标是促进语音识别端到端模型的研究。这些模型在PyTorch中实现。

该软件仅在Python2.7中测试过，但我们打算同时支持2.7和3.5。

安装

我们建议创建一个虚拟环境并在那里安装python需求。

virtualenv

source /bin/activate

pip install -r requirements.txt

然后按照适用于您的机器的PyTorch版本的安装说明进行操作。

在安装了所有python需求之后，从顶层目录运行：

make

构建过程需要CMake以及Make。

之后，setup.sh从源码安装。

source setup.sh

考虑把这个添加到你的bashrc。

您可以通过运行tests目录中的测试来验证安装是否成功。

cd tests

pytest

运行

训练模型运行

python train.py

模型完成训练后，您可以使用

python eval.py

要查看每个脚本使用的可用选项-h：

python {train, eval}.py -h

例子

有关模型配置和数据集的示例，请访问示例目录。每个示例数据集应具有用于下载和准备数据的指令和/或脚本。还应该有一个或多个模型配置可用。每个配置的结果将记录在每个对应的例子中README.md。

姓名地址：Github

原创文章，转载请注明：PyTorch通过ASR实现语音到文本端的模型以及pytorch语音识别(speech) - pytorch中文网

原文出处： https://ptorch.com/news/81.html

问题交流群：168117787

weixin_39593523

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。