山东大学软件学院项目实训（四）

潜光隐耀.

已于 2024-05-08 18:13:07 修改

阅读量89

点赞数 2

文章标签：交互

于 2024-05-06 18:26:12 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_63291405/article/details/138503966

版权

本文介绍了通过科大讯飞语音听写技术实现的1分钟内实时语音转文字系统，使用WebSocket协议进行数据传输，包括签名验证、数据上传、结果接收及错误处理。系统准确识别语音内容，具有高精度和时间计算功能。

摘要由CSDN通过智能技术生成

本周实现了语音转文本后端代码的编写。

项目结构如下所示：

本实现通过调用科大讯飞的语音听写技术，其主要用于1分钟内的即时语音转文字技术，支持实时返回识别结果，达到一边上传音频一边获得识别文本的效果，这便于我们后续的开发。

接口调用流程如下：

通过接口密钥基于hmac-sha256计算签名，向服务器端发送Websocket协议握手请求。
握手成功后，客户端通过Websocket连接同时上传和接收数据。数据上传完毕，客户端需要上传一次数据结束标识。
接收到服务器端的结果全部返回标识后断开Websocket连接。

常量的定义类似于tts，不过这里指定的是待识别的文件的位置，而tts指定的是转化的文本的内容。

程序继承WebSocket类，重写了一些方法，以处理WebSocket连接的打开、消息接收和失败事件。运行时会根据不同的状态（第一帧、中间帧、最后一帧）构建不同的JSON格式数据，并发送到服务端。当接收到服务端返回的消息时，程序解析消息并进行处理。如果返回的消息包含错误码，程序将打印错误信息和错误码查询链接。如果消息包含识别结果，程序将对结果进行解码并打印。

程序的工作流程如下：

建立WebSocket连接。
在连接打开后，发送音频数据。
接收服务端返回的识别结果，并进行解码和打印。
处理连接失败事件。

将tts生成的文本传入进行处理，处理结果如下图所示

可以看出，准确地识别出了语音对应的内容，与生成时输入的文本一致，识别准度好，同时还计算了识别耗时，对于其他方面的应用有一定的作用。

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
山东大学软件学院项目实训（四）

本周对于语音转文本和文本转语音进行了相关优化。
复制链接

扫一扫

潜光隐耀. CSDN认证博客专家 CSDN认证企业博客

码龄3年

9: 原创

137万+: 周排名

13万+: 总排名

1656: 访问

: 等级

112: 积分

17: 粉丝

19: 获赞

2: 评论

11: 收藏

私信

关注

热门文章

最新评论

山东大学软件学院项目实训（四）
普通网友: 干货满满，实用性强，博主的写作风格简洁明了，让人一目了然。文章涵盖了很多实用的知识点。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
山东大学软件学院项目实训（三）
CSDN-Ada助手: 太棒了！看到你在软件学院项目实训中取得进展真是让人振奋！继续保持努力，坚持学习和实践，相信你一定会取得更多的成就。除了语音转文本和文本转语音的后端实现，如果你有机会，也可以尝试学习一些前端开发技能，比如HTML、CSS、JavaScript等，这样可以让你在项目中担任更多的角色，提升自己的综合能力。加油！期待看到你更多的精彩内容！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
山东大学软件学院项目实训（一、二）
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天最佳新人】榜单，全部的排名请看 https://bbs.csdn.net/topics/618524177。

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。