智能家居
文章平均质量分 90
mcu-ai
开源、低功耗、低成本的人工智能硬件提供者
展开
-
“MCU+AI”市场前景光明
对此,MCU资深产品经理王斌认为,在MCU中加入AI加速器后,可以从两方面着手,去平衡产品的低功耗与高效的AI计算能力之间的关系。芯片厂商需要在设计过程中进行权衡,确保在满足用户需求的同时,将MCU的制造复杂度和成本控制在可接受的范围内,并平衡功耗带来的负面影响。因此,在MCU有限的计算资源和存储空间基础上,实现高算力的AI功能具有一定挑战性。尽管MCU+AI的市场前景光明,现阶段在MCU中引入AI加速器仍存在一定的挑战性,需要芯片厂商在技术上做出平衡和优化,同时还要充分考虑用户需求和数据安全。原创 2024-04-29 15:37:17 · 324 阅读 · 1 评论 -
基于毫米波雷达的手势识别算法
在本文中,我们利用一种新的数据处理方法和定制的人工卷积神经网络(CNN)设计了一个远程手势识别模型。首先,我们将手势分解为多个反射点,并提取它们的时空特征来描述手势的细节。其次,我们设计了一个CNN来分别学习提取特征的变化模式并输出识别结果。我们通过在商品毫米波雷达上实施,对我们提出的系统进行了全面评估。此外,我们还提供了更广泛的评估,以证明所提出的系统在几个现实世界场景中是实用的。原创 2024-04-29 15:25:10 · 1157 阅读 · 3 评论 -
实时的语音降噪神经网络算法
我们提出了微小递归U-Net(TRU-Net),这是一种轻量级的在线推理模型,与当前最先进的模型的性能相匹配。TRU-Net的量化版本的大小为362千字节,足够小,可以部署在边缘设备上。此外,我们将小型模型与一种称为相位感知β-sigmoid掩模的新掩模方法相结合,该方法能够同时去噪和去混响。客观和主观评估的结果都表明,我们的模型可以在基准数据集上使用更少数量级的参数,实现与当前最先进模型的竞争性能。原创 2024-04-28 09:11:45 · 1422 阅读 · 5 评论 -
基于深度学习的鸟类声音识别系统
本文构建了一个包含264种鸟类的大数据集,以增强模型的泛化能力,然后提出了一个轻量级的鸟类声音识别模型,以MobileNetV3为骨干构建了一种轻量级的特征提取和识别网络。通过调整模型中的深度可分离卷积,提高了模型的识别能力。设计了一种多尺度特征融合结构,并在该结构中加入了金字塔分割注意力(PSA)模块,以提高网络对空间信息和通道信息的尺度提取的适应性。为了提高模型对全局信息的细化能力,在Bneck模块中引入了通道注意机制和普通卷积,使Bneck模型成为Bneck模。原创 2024-04-28 08:58:31 · 1371 阅读 · 1 评论 -
关键词识别神经网络
KWS的目标是在低误报(FA)率下最大化检测精 度,同时最小化占用空间大小、延迟和复杂性。为 了实现这些目标,我们研究了卷积循环神经网络(CRNN)。受到大规模最先进语音识别系统的启发, 我们结合了卷积层和循环层的优势来利用局部结构 和远程上下文。我们分析了架构参数的影响,并提 出了提高性能的训练策略。我们的CRNN模型仅使 用约230k参数,即可产生可接受的低延迟,并在0.5 FA/小时、5 dB信噪比下实现97.71%的准确 度。原创 2024-04-27 16:11:55 · 788 阅读 · 1 评论 -
环境声音分类的深度 CNN 模型
声音事件的分类精度与特征提取有很强的关系。本文将深度特征用于环境声音分类(ESC)问题。深层特征是通过使用新开发的卷积神经网络(CNN)模型的全连接层来提取的,该模型通过频谱图图像以端到端的方式进行训练。特征向量由所提出的CNN模型的全连接层串联而成。为了测试所提出方法的性能,将特征集作为输入传送到随机子空间K最近邻(KNN)集成分类器。在DCASE-2017 ASC和UrbanSound8K数据集上进行的实验研究表明,所提出的CNN模型的 分类准确率分别为96.23%和86.70%。原创 2024-04-27 15:07:09 · 1386 阅读 · 5 评论 -
轻便高效的音频分类神经网络
在本文中,我们提出了一 种基于设备上深度学习的轻量级音频分类模型LEAN。LEAN由称为Wave Encoder的基于原始波形的时间特 征提取器和基于logmel的预训练YAMNet组成。我们 证明,结合使用可训练的波编码器、预训练的YAMNet以及基于交叉注意力的时间重新调整,可以在下游音频 分类任务上获得具有竞争力的性能,同时占用更少的内 存,从而使其适用于资源受限的设备,例如移动设备、 边缘设备等。原创 2024-04-27 14:38:36 · 543 阅读 · 1 评论 -
基于毫米波的人体跟踪和识别算法
在本文中,我们提出了RadHAR,这是一种使用稀疏和非均匀点云执行精确HAR的框架。RadHAR利用滑动时间窗口来累积毫米波雷达的点云,并生成体素化表示,作为分类器的输入。原创 2024-04-26 13:17:31 · 989 阅读 · 3 评论