使用环境音频数据在ESP32-S3微控制器上实现嵌入式实时人类活动识别

这篇论文的标题是《Embedded Real-time Human Activity Recognition on an ESP32-S3 Microcontroller Using Ambient Audio Data》,作者是 Thomas Pfitzinger 和 Hendrik Wöhrle,来自德国多特蒙德应用科学与艺术大学。论文发表在2023年9月7日至9日举行的第12届IEEE国际智能数据采集与高级计算系统会议(IDAACS)上。

摘要:

  • 本研究探讨了在微控制器上直接进行人类活动识别(HAR)的可能性,以减少网络流量和能源消耗,并解决隐私问题。
  • 研究开发了一种智能传感器设备,该设备使用环境音频数据在ESP32-S3微控制器上实时进行HAR。
  • 研究设计了一个卷积神经网络(CNN)来分类人类活动,并通过神经架构搜索简化了模型,以适应微控制器的资源限制。
  • 研究在ESP32-S3上测试了模型,并确定了可行的版本。

关键词:

  • 嵌入式系统
  • 人类活动识别
  • 机器学习
  • 神经架构搜索
  • 微控制器

主要内容:

I. 引言

  • 介绍了HAR的重要性,特别是在智能家居和辅助生活中的应用。
  • 讨论了在云服务器上进行机器学习任务的资源密集型问题,以及在嵌入式设备上直接处理传感器数据的优势。
  • 论文的目标是在ESP32-S3微控制器上实现实时HAR,使用环境音频作为输入。

II. 开发

  • 分析了微控制器的硬件资源。
  • 设计了一个基于VGG-16的CNN模型,并对其进行了简化,以适应硬件限制。
  • 实现了在微控制器上的测试环境。

III. 结果

  • 基础模型在13个类别上训练,准确率达到93.18%。
  • 通过神经架构搜索,实现了模型大小减少98.5%,计算成本减少99.4%。
  • 简化模型的准确性略有下降,但仍然保持在较高水平。

IV. 结论

  • 在资源受限的ESP32-S3微控制器上实现了13类HAR。
  • 通过结构变化和神经架构搜索,显著减少了模型大小和计算成本。
  • 提出了将神经架构搜索结果与模型剪枝和知识蒸馏相结合的建议,以实现更好的压缩与准确性比率。

识别的13类人类活动(HAR)包括:

  1. 开关门
  2. 关闭洗碗机、激活烤面包机
  3. 使用咖啡机(意式咖啡机)
  4. 在椅子上坐下和起立
  5. 行走
  6. 在键盘上打字
  7. 吸尘清扫和扫地
  8. 无活动

参考文献

  • 论文列出了一系列与HAR、机器学习、嵌入式系统相关的参考文献。

图表和数据

  • 论文中包含了多个图表,如模型结构、神经架构搜索结果的Pareto前沿、模型在微控制器上执行的结果等。
  • 提供了模型参数、计算成本和准确性的详细数据。

研究意义:

  • 本研究展示了在嵌入式设备上实现HAR的可行性,这对于智能家居和辅助生活领域具有重要意义。
  • 通过减少模型大小和计算成本,使得在资源受限的设备上部署HAR模型成为可能。

论文的核心贡献在于展示了如何在资源受限的微控制器上实现实时HAR,并通过神经架构搜索技术显著优化了模型的性能和效率。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

神一样的老师

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值