山东大学软件学院项目实训（三）

潜光隐耀.

已于 2024-05-08 17:44:16 修改

阅读量87

点赞数 1

文章标签：交互

于 2024-04-30 19:44:31 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_63291405/article/details/138355266

版权

本周进行了文本转语音(tts)的后端实现。

项目结构如下：

本实现通过调用科大讯飞的语音合成技术，其通过Websocket API的方式给开发者提供一个通用的接口。Websocket API具备流式传输能力，适用于需要流式数据传输的AI服务场景，这和我们项目的目标相一致。相较于SDK，API具有轻量、跨语言的特点；相较于HTTP API，Websocket API协议有原生支持跨域的优势。

接口调用流程如下：

通过接口密钥基于hmac-sha256计算签名，向服务器端发送Websocket协议握手请求。
握手成功后，客户端通过Websocket连接同时上传和接收数据。数据上传完毕，客户端需要上传一次数据结束标识。
接收到服务器端的结果全部返回标识后断开Websocket连接。

然后开始对接口进行调用和实现，初步如下图

首先定义一些常量，包括tts服务对应的url，与个人请求服务相关的账号密钥，指定文本编码格式，发音人，目标文件名称及最终存储路径，然后输入想要合成的文本，最终得到想要的结果。

程序的主函数，它首先获取授权的WebSocket URL，然后创建一个FileOutputStream来保存合成的音频，并调用websocketWork方法来处理WebSocket连接。

其余部分不一一展示，程序的工作流程如下所示：

使用getAuthUrl方法获取授权的WebSocket URL。
通过websocketWork方法建立WebSocket连接。
在连接建立后，启动MyThread线程发送请求参数和要合成的文本。
服务器处理请求并返回音频数据，程序将这些数据写入到文件中。
一旦音频合成完成，关闭WebSocket连接并释放资源。

代码中还使用了Base64编码来处理文本数据，并且使用了Gson库来解析JSON响应。此外，还使用了Java的javax.crypto包来进行HMAC-SHA256签名，使程序可靠性较好。

运行程序后，在对应目录下出现了合成完成的mp3文件，也可以顺利进行播放，调用完成。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
山东大学软件学院项目实训（三）

本周进行了文本转语音的后端实现。
复制链接

扫一扫

潜光隐耀. CSDN认证博客专家 CSDN认证企业博客

码龄3年

9: 原创

137万+: 周排名

13万+: 总排名

1656: 访问

: 等级

112: 积分

17: 粉丝

19: 获赞

2: 评论

11: 收藏

私信

关注

热门文章

最新评论

山东大学软件学院项目实训（四）
普通网友: 干货满满，实用性强，博主的写作风格简洁明了，让人一目了然。文章涵盖了很多实用的知识点。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
山东大学软件学院项目实训（三）
CSDN-Ada助手: 太棒了！看到你在软件学院项目实训中取得进展真是让人振奋！继续保持努力，坚持学习和实践，相信你一定会取得更多的成就。除了语音转文本和文本转语音的后端实现，如果你有机会，也可以尝试学习一些前端开发技能，比如HTML、CSS、JavaScript等，这样可以让你在项目中担任更多的角色，提升自己的综合能力。加油！期待看到你更多的精彩内容！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
山东大学软件学院项目实训（一、二）
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天最佳新人】榜单，全部的排名请看 https://bbs.csdn.net/topics/618524177。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。