华为云耀云服务器L实例高级篇-部署自己的语音识别api

华为云耀云服务器L实例是一款可快速部署且易于运维的轻量级云服务器,专为中小企业和入门级开发者打造。它不仅拥有华为云擎天架构的强大性能,还具有多项用户体验优化方案,让用户轻松上手,享受简单上云的乐趣。

本产品网址为:https://www.huaweicloud.com/product/hecs-light.html

在当今数字化时代,语音合成技术正变得越来越重要。无论是在智能助手、语音导航还是语音广播等领域,语音合成都扮演着重要的角色。如果你也想在华为云耀云服务器L实例上搭建一个自己的语音合成API,以便将文字转换为自然流畅的语音,那么你来对地方了!本文为一份详细的部署实测,帮助大家快速搭建自己的语音合成API,为我们的应用或项目增加强大的语音合成能力。

ASRT是一个基于深度学习的中文语音识别系统,本项目使用tensorFlow.keras基于深度卷积神经网络和长短时记忆神经网络、注意力机制以及CTC实现。

下载文件

现在我们来到asrt项目的wiki下,先将文件下载到本地,并将压缩包解压。

网址为 https://wiki.ailemon.net/docs/asrt-doc/download

8b0dcdc105ac6ad8ebb0b3a8167c5977.jpeg

17f9cbbcd9bf08b63825501fe57c0331.jpeg

dbaa8ee25b7ed9b16450b4a2b957f9ec.jpeg

现在我们来到宝塔面板,点击 文件-上传,将我们的服务端文件夹ASRT_v1.3.0上传到我们的华为云耀云服务器L实例上。(目录可以不同,但记得下方所有操作可能都要先跳转到该目录下再执行指令)

eece63ccf38884154d222c47fca84132.jpeg

7c34fae3a9ab26ef4bec2f1248c16df4.jpeg

这样,我们的第一步就完成了。

安装依赖包

我们刚刚上传的ASRT_v1.3.0文件夹中已经包含所需要的包依赖,可以直接一键运行。

pip install -r requirements.txt

来一键下载包依赖

1265b257cd1c528d58488652a70b86b9.jpeg

但我个人此处由于未知原因下载失败,于是我选择手动下载每个依赖(在官方文档中有说明),如果上方的指令下载成功,就可以跳过下方这一部分了。

pip install tensorFlow

c87aa70fb15d3cd88fba26bb61b524c9.jpeg

pip installnumpy

73aa4121511d2875d171200d67761fda.jpeg

pip install wave

c17b93c228cea31c5ebcbebc2a68162c.jpeg

pip install matplotlib

3dee13489ee2e6f7cc8e2c9b156a88e0.jpeg

pip install scipy

04df4d62ddf2c51ce9b4f9dd024228cc.jpeg

pip install requests

607de1d51e42c9cf28b3efbe67d37f5a.jpeg

pip install flask

4235a7cbfbd9375c15b0854e5e0eacaa.jpeg

pip install waitress

3f4824d6dfc7ce8c9bd9eeb0d761d6da.jpeg

pip install grpcio

976e32b5e5290e3f800088bc54b59c33.jpeg

设置端口

现在我们来针对asrt端口打开我们华为云耀云服务器L实例的防火墙,打开宝塔面板,点击 安全-添加端口规则

1a8bccac2e4da834c5197a23a82b41c0.jpeg

将如下端口20001添加并提交(如果该端口已占有,可以尝试修改运行文件找一个不用的端口,并在这里开启对应端口)

fa989feee513fe351b0912f77e9cc59b.jpeg

接着我们来到我们的华为云耀云服务器L实例控制台界面,点击 安全组-配置规则

a94a5ad5f526dce72f50eafe189d2eab.jpeg

在入方向规则中,点击添加规则,依旧将端口20001填入,如下图

63627958e102f471ddd7e70c7cc2d326.jpeg

24a3aad4b8c4580ed3f2cd54e1d23c5c.jpeg

这样,我们的准备工作就基本完成了!

运行并测试api

我们首先打开自己的Shell连接到云耀云服务器,输入指令转到ASRT_v1.3.0文件夹下

cd ASRT_v1.3.0

然后执行服务端的运行文件

python asrserver_http.py

f28f3b5b77a0b834f7c4f360f6e5aef2.jpeg

那么现在,让我们访问一下我们的api网页界面,在我们的浏览器中输入 华为云耀云服务器L实例IP:20001,可以看到以下界面,说明api已经可以正常工作了!

820670448f333ffded8cb6abd651571b.jpeg

之后,我们使用官方提供的测试工具,配置好我们的api接口,即可在 客户端 使用免费的语音识别api了!

那么让我们使用之前下载的测试工具测试一下。

打开之前下载文件时的另一个文件夹ASRT_SDK_WinClient_WithDemo_v1.1.0

6c18af80b3d3e2ab8a10a594c12151b6.jpeg

然后接着运行ASRT_SpeechClient_WPF.exe

d7d90fcd2f99a1a7a0c32be9c169823b.jpeg

我们可以看到这是一个简单的测试程序,点击开始输入(当然一可以点击下方直接选择wav格式文件,注意不要太大):

c57fd551f40f87bdaedd242380cef6a5.jpeg

之后我们可以看到识别结果如下,很正确:

fb29772a5cdbf83d66c4e4a250c95ff1.jpeg

当然,我们正常使用语音识别功能不可能在这个测试界面使用,但只要我们已经在华为云耀云服务器L实例上部署并启动了这个功能,然后我们在需要使用的地方向我们的华为云耀云服务器L实例IP:20001 这个地址以post请求发送所要识别的wav语音文件即可进行识别!

通过本文,我们已经成功在华为云耀云服务器L实例上搭建了ASRT的语音合成API。现在,我们可以使用这个API将文字转换为自然流畅的语音,为我们的应用或项目增加更好的用户体验。云端搭建的语音合成API具有高度可扩展性和灵活性,可以满足不同场景和需求的语音合成任务。希望本文对大家有所帮助,祝大家成功地搭建自己的语音合成API,并享受使用这一强大技术的乐趣!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

杨老师技术评论

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值