研究人员缩小了最先进的计算机视觉模型,使其可以在低功耗设备上运行。
成长的烦恼:视觉识别是深度学习的最强技能。计算机视觉算法正在分析医学图像,启用自动驾驶汽车并增强人脸识别能力。但是,用于识别视频中动作的训练模型变得越来越昂贵。这引发了人们及其在低资源环境中担忧。
.实验室的研究人员现已开发出一种新技术,用于在处理能力非常有限的电话或其他设备上训练视频识别模型。通常,算法会通过将视频分割成图像帧并在每个图像帧上运行识别算法来处理视频。然后,通过查看对象在后续帧中的变化情况,将视频中显示的动作组合在一起。该方法要求算法"记住"在每个帧中看到的内容以及看到顺序。这不必要地效率低下。
在新方法中,该算法改为提取每一帧中对象的基本草图,然后将它们彼此叠加。通过查看对象如何在草图中的空间中移动,该算法无需记住发生的情况,而可以对时间的流逝印象深刻。在测试中,研究人员发现,这种新方法训练视频识别模型的速度是最新技术的三倍。它也能够使用一台小型计算机和摄像头快速,而摄像头和摄像头仅依靠足够的能量来为自行车灯供电。
重要性:这项新技术可以帮助减少计算机视觉的现有商业应用中的延迟和计算成本。例如,它可以通过加快对传入的视觉信息的反应,使自动驾驶汽车更安全。该技术还可以解锁以前无法实现的新应用程序,例如通过启用电话来帮助诊断患者或分析医学图像。
分布式AI:随着越来越多的AI研究被转化为应用程序,对微型模型的需求将会增加.
分享
![f5c0f9bc92d4540c761daa962f9cf667.png](https://img-blog.csdnimg.cn/img_convert/f5c0f9bc92d4540c761daa962f9cf667.png)