基于ESP32的语音识别系统

Alreiters

已于 2024-08-20 21:53:25 修改

阅读量416

点赞数 5

文章标签：语音识别人工智能单片机嵌入式硬件

于 2024-08-01 10:13:28 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_63481710/article/details/140828061

版权

一、简介

本项目的目的是制作一个简单常见的语音识别设备，识别出语音中的特定词汇以启动，并识别和完成特定指令。

二、硬件部分

硬件部分包括：ESP32，麦克风，扬声器，LED灯

三、语音识别模型

1.训练数据

使用包含 36 个声音类别的开源数据集，将音频分割成片段，并为每个片段生成频谱图。

训练数据

2.训练模型

使用卷积神经网络 (Convolutional Neural Network, CNN)，两个卷积层（Convolutional Layer）、一个最大池化层（Max Pooling Layer）、一个展平层（Flatten Layer）、一个Dropout层以及多个全连接层（Dense Layers），Adam优化器。

训练结果

3. 转换为TFLite（TensorFlow Lite）模型

量化：将 32 位浮点数转换为 8 位整数，使用紧凑参数缩小模型大小，定义生成器函数，提供具有代表性的数据集样本，生成器函数从完整的训练数据集中提取小批量数据，这些样本将提供给 TFLite 转换器，用于计算转换参数。

四、网络连接语音识别模型

1.利用应用程序接口进行语音识别

利用API（Application Programming Interface，应用程序编程接口），将捕捉到的音频输入转换为基于文本的命令，充分利用其先进的自然语言处理能力；将音频数据从 ESP32 传输到云服务端，确保可靠、准确的语音识别；定制语言模型，以识别特定的语音命令。

2.使用百度语音识别

百度语音识别

检查 wi-fi 连接状态，使用 JSON 发送数据与返回结果，逐块发送数据，将数据合并在一起。

接收并解析来自 API 的文本命令，将识别到的命令映射到 ESP32 固件中的相应功能，根据识别到的语音命令触发相应的 ESP32 操作。

五、实物图

六、项目总结

1.工作内容

成功将音频识别与 ESP32 集成，利用 API 进行语音到文本的转换，实现语音控制智能功能。

2.不足

因为网络连接超时和ESP32内存的限制，我们无法在短时间内调用语音识别 API 并将数据导入 ESP32。

3.改进

探索和扩展语音控制功能，以包含更广泛的命令，与其他智能家居设备集成，并进一步优化系统性能和用户体验。

X. L. GUO, Y. X. YANG, H. X. Liu, J. X. Peng

Reference: https://github.com/atomic14/diy-alexa

关注

5
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
基于ESP32的语音识别系统

成功将音频识别与 ESP32 集成，利用 API 进行语音到文本的转换，实现语音控制智能功能。
复制链接

扫一扫

Alreiters CSDN认证博客专家 CSDN认证企业博客

码龄3年

4: 原创

129万+: 周排名

11万+: 总排名

4502: 访问

: 等级

98: 积分

40: 粉丝

58: 获赞

1: 评论

90: 收藏

私信

关注

热门文章

最新评论

电子实习项目：直流稳压电源的设计与安装
CSDN-Ada助手: 恭喜您开始了博客创作的第一步！标题看起来非常专业和有趣，对直流稳压电源的设计与安装感兴趣的读者一定会被吸引。接下来，建议您可以在博客中详细介绍设计的过程和安装的步骤，同时分享一些自己的实践经验和心得，这样可以让读者更加深入地了解这个主题。希望您在未来的博客创作中不断进步，分享更多有价值的内容！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
电子设计项目：手动电子琴设计
CSDN-Ada助手: 非常棒的博客！你的手动电子琴设计项目听起来非常有趣和具有挑战性。希望你能继续分享更多关于电子设计的经验和项目。除了NE555模块，你可能还可以尝试使用Arduino或者Raspberry Pi等微控制器来实现更多功能，比如添加音效、录音和播放功能等。希望你可以继续学习和探索，不断提升自己在电子设计领域的技能！期待看到你未来更多的作品！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
基于Python的SQL所建立DB2数据库转译的实现
CSDN-Ada助手: MySQL入门技能树或许可以帮到你：https://edu.csdn.net/skill/mysql?utm_source=AI_act_mysql

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。