Methodology

鱼儿会飞吗

于 2024-10-05 09:47:10 发布

阅读量115

点赞数 3

文章标签：深度学习人工智能机器学习计算机视觉 python

本文链接：https://blog.csdn.net/qq_34425255/article/details/142711451

版权

在实际应用中，神经网络的设计更关注于快速运行和优化并行计算，而不是单纯追求理论上的计算性能指标（如BFLOP，表示每秒浮点运算次数）。以下是具体解释和例子：

图像识别：
- 在自动驾驶汽车中，神经网络需要实时处理来自摄像头的数据，以识别行人、车辆和交通标志。在这种情况下，快速的处理速度是至关重要的，而不是仅仅关注模型的理论计算性能。
语音助手：
- 像Siri或Alexa这样的语音助手需要快速理解和响应用户的语音命令。为了实现流畅的用户体验，系统需要优化并行计算能力，以便在短时间内处理大量语音数据。

因此，设计实时神经网络时，更应关注如何提高运行速度和优化资源利用，而不是单纯追求理论计算指标的低值。

我们提出了两种实时神经网络的选项：

对于GPU，我们在卷积层中使用少量的组（1到8个）：CSPResNeXt50 / CSPDarknet53。
对于VPU，我们使用分组卷积，但不使用挤压和激励（Squeeze-and-Excitation, SE）模块。具体包括以下模型：EfficientNet-lite / MixNet / GhostNet / MobileNetV3。

VPU是“视觉处理单元”（Vision Processing Unit）的缩写。它是一种专门设计用于处理计算机视觉任务的处理器，通常用于嵌入式系统和移动设备中。VPU的特点包括：