模型案例:| 音频识别 - 玻璃破碎识别模型

2023年以ChatGPT为代表的大语言模型横空出世,它的出现标志着自然语言处理领域取得了重大突破。它在文本生成、对话系统和语言理解等方面展现出了强大的能力,为人工智能技术的发展开辟了新的可能性。同时,人工智能技术正在进入各种应用领域,在智慧城市、智能制造、智慧医疗、智慧农业等领域发挥着重要作用。

柴火创客2024年将依托母公司Seeed矽递科技在人工智能领域的创新硬件,与全球创客爱好者共建“模型仓”,通过“SenseCraft AI”平台可以让使用者快速部署应用体验人工智能技术!

本期介绍:模型案例:| 音频识别 - 玻璃破碎识别模型

神经网络中的学习率

神经网络中的学习率是一个关键超参数,它决定了模型在训练过程中参数更新的步长。 学习率的设置对模型的训练效果有直接影响。

定义与作用: 学习率定义了每次迭代中模型权重更新的大小,它直接影响模型在损失函数上的移动速度。如果学习率设置得太高,模型可能会在训练过程中跳过最优解;如果设置得太低,则训练过程会变得非常缓慢,需要很长时间才能收敛到最优解。‌

调整方法: 学习率的调整可以根据经验值开始,如0.001、0.0001等,并根据训练过程中的表现进行调整。此外,可以根据数据集的大小、模型的复杂度等因素动态调整学习率,例如使用学习率衰减策略,在训练初期使用较大的学习率以快速收敛,随着接近最优解时逐渐减小学习率以避免错过最优解。

自适应学习率算法: 为了更好地适应不同的训练阶段和模型状态,可以使用自适应学习率算法,如Adam、Adagrad等,这些算法能够根据参数的梯度信息自动调整学习率,从而提高训练效率和稳定性。

玻璃破碎声音识别模型

随着智慧城市理念的不断推进,智能建筑已经成为现代建筑设计的重要方向。在这一新的建筑范式中,安全性和能效性是设计的核心要素之一。玻璃作为建筑外立面的重要材料,其脆弱性使得监测玻璃破碎事件变得尤为重要。为此,开发一个高效的玻璃破碎监测系统显得尤为必要。

玻璃破碎不仅可能导致财产损失,还可能对建筑内的人员安全造成威胁。随着城市化进程的加快,智能建筑中使用的大面积玻璃越来越普遍。因此,及时监测并响应玻璃破碎事件,能够有效减少事故发生后的后果,提升安全管理水平。

该模型用于对玻璃破碎声音的识别,采用MFCC识别技术,生成TensorFlow Lite INT8格式文件。

应用场景

  1. 安全监控
    家庭安全:自动检测家庭中玻璃破碎声,及时通知用户或报警,防止入室盗窃。
    商店监控:用于零售商店,提高安全性,防范盗窃行为。
  2. 工业应用
    生产线监测:在制造和装配过程中,实时监测设备或材料的破损,及时发现问题,减少损失。
    材料质量检测:在玻璃生产中,监测破碎声以判断材料质量和一致性。
  3. 交通监控
    公共交通:在公交车或火车上监测玻璃破碎声,提高乘客安全,及时处理事故。
  4. 环境监测

垃圾处理:监测垃圾处理设施中的玻璃破碎声,提高处理效率和安全性。

噪声监测:评估城市环境中的玻璃破碎声对居民的影响。

识别模型Arduino 库文件下载

请在网盘中下载Arduino 库识别模型

https://share.weiyun.com/uh2s9DAU

模型推理Arduino程序下载

https://share.weiyun.com/cL8NDWS6

边缘端部署

可以将此模型直接部署在XIAO Esp32S3 Sense 开发板上,实现无网络环境下也能进行预测推理。

硬件清单

为了连接Oled显示屏,需要提前将XIAO ESP32S3(Sense)焊接上针脚,并按下图所示进行接线。

添加Arduino推理库文件

1、打开Arduino IDE软件,单击“工具” 》“导入库” 》“添加ZIP库”,如下图所示。

2、找到并选择玻璃破碎声音识别库文件,单击“打开”按钮,如下图所示。

3、推理库文件添加成功后,打开语音识别Arduino程序,添加此库文件到程序的头部,如下图所示。

4、打开PSRAM选项,设置好开发板类型和端口号后,即可上传程序了,如下图所示。

5、程序上传成功后,oled显示屏可以输出预测结果和置信率,如下图所示。可以输出两个结果:background 代表背景噪音,glassbreak 代表玻璃破碎声音。

下面是上传成功后的演示视频:

玻璃破碎声音识别模型演示

另,关于程序部署如果用到困难,建议先看一下此教程

具体部署教程参考如下:

https://wiki.seeedstudio.com/edgeimpulse/#fruit-identification-apples-bananas-grapes-arduino-library

XIAO ESP32S3 Sense 套装介绍

XIAO ESP32S3(Sense)

强大的 MCU 板:集成ESP32S3 32 位双核 Xtensa 处理器芯片,运行频率高达 240 MHz,安装多个开发端口,支持 Arduino/MicroPython

高级功能:可拆卸OV2640相机传感器,分辨率为1600*1200,兼容OV5640相机传感器,集成附加数字麦克风

超强内存,带来更多可能性:提供 8MB PSRAM 和 8MB 闪存,支持 SD 卡插槽,用于外部 32GB FAT 内存

出色的射频性能:支持2.4GHz Wi-Fi和BLE双无线通信,连接U.FL天线时支持100m+远程通信

拇指大小的紧凑型设计:21 x 17.5mm,采用XIAO的经典外形,适用于可穿戴设备等空间有限的项目

来自 SenseCraft Al 的用于无代码部署的预训练 Al 模型。

写在最后

SenseCraft-AI平台的模型仓数量还很少,但是好消息是它支持自定义模型上传并输出推理结果,平台会逐渐增加模型仓的数量,敬请关注!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值