手语识别机器学习_用于目标识别的自学习机器视觉系统

最新推荐文章于 2024-05-27 11:23:24 发布

weixin_39608398

最新推荐文章于 2024-05-27 11:23:24 发布

阅读量335

点赞数

文章标签：手语识别机器学习

本文链接：https://blog.csdn.net/weixin_39608398/article/details/112220849

版权

本文探讨了机器视觉在工业4.0中的重要性，特别是深度学习技术在目标识别中的应用。深度学习通过卷积神经网络实现高识别率，但面临计算资源需求高、不适合高速精确定位等挑战。预先训练的深度学习网络可以降低工作量，但开源解决方案可能带来许可证问题和集成困难。专有软件则提供预训练网络和更好的集成选项，更适合工业应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

机器视觉是工业4.0，即工业物联网背景下高度自动化和无缝联网过程的关键技术。使用诸如深度学习之类的新的人工智能过程变得越来越重要。许多好处使这项技术具有吸引力，但同时它也有局限性。

工业生产的自动化正在迅速发展。完全网络化和数字化的流程链在生产车间早已司空见惯。在工业4.0和智能工厂中，所有涉及的组件——包括机器、机器人、传输和处理系统、传感器和图像采集设备——一起工作，彼此无缝通信。机器人领域也出现了一种新趋势:小型、紧凑的移动机器人，即协作机器人(collaborative robots, cobots)正在加入生产流程，并经常与人类同事密切合作。cobots的最大好处是，它们可以快速地重新装备，并且只需很少的工作，这使得灵活地使用它们来完成不同的生产任务成为可能。

伴随并支持整个价值创建过程的互补技术在这些高度自动化的场景中扮演着重要的角色。这些包括，例如，可编程逻辑控制器(plc)和机器视觉。后者作为“生产之眼”实时观察和监控生产过程。图像采集设备，如相机、扫描仪和3D传感器，被放置在多个位置，并从不同的角度记录过程。生成的数字图像数据通过集成的机器视觉软件进行处理，可用于处理链中的各种任务。例如，可以根据光学特性可靠地检测目标并精确定位。该技术还可以检测产品的制造故障，从而自动排除故障，从而优化质量保证流程。

基于卷积神经网络(CNNs)架构的深度学习

越来越多的先进人工智能(AI)技术被纳入机器视觉系统。其中一项技术是基于卷积神经网络(CNN)体系结构的深度学习。大量的数字图像信息用于广泛的培训过程。基于这些数据，软件可以独立地对新对象进行分类。在训练过程中，自动学习特定对象类的特征。因此，新的图像数据可以精确地分配给它们的特定类别，从而产生非常高和强大的识别率。这些深度学习算法也适用于精确目标定位和缺陷识别。

机器视觉是“生产之眼”

深度学习技术注定要在机器视觉应用程序的某些领域使用。这些主要包括分类、对象检测和语义分割。这就是智能算法的优势所在。然而，在其他机器视觉应用中，深度学习的适用性有一定的局限性。由于需要分析大量的数据，训练过程通常需要非常大的计算能力和适当尺寸的硬件。特别是在时间非常关键的应用程序中，标准CPU通常是不够的。不适用于高速应用程序，例如高精度测量任务和具有毫米或微米精度的目标定位。在这种情况下，深度学习算法在一个标准CPU上需要50到100毫秒。然而，这种精确定位只需要几毫秒。这里需要的是一个功能强大的GPU，通常 GPU是不适用于工业用途的硬件。

深度学习并非适用于所有应用

在工业应用中，深度学习也不是最佳选择，例如在电子和半导体工业中，要检测或识别的对象与实际情况非常相似。由于这些组件通常具有非常相似的外观，因此使用传统机器视觉方法进行培训只需要几个示例图像。在许多情况下，即使是单个图像也足以可靠地检测到对象并精确定位它们。然而，只有当每个对象至少有100个训练图像可用时，使用深度学习算法才有意义。因此，使用常规方法(如基于规则的软件技术)可以更好地解决机器视觉任务，其中要识别的对象非常相似。特别是对于读取数据代码和条形码，采用启发式算法而不是深度学习算法。对目标的度量，如亚像素精确轮廓提取，也依赖于启发式算法。

然而，在深度学习能够带来全部好处的应用中，必须考虑某些挑战。深度学习是一种相对较新的技术，市场对其提供的通用标准很少。此外，深度学习的整体处理非常复杂，需要深入的知识以及在人工智能、编程和机器视觉领域的多年经验。这通常超出了一般公司的能力，因为他们缺乏必要的专业人才。

通过预先培训的深度学习网络减少工作量

然而，有些公司可以通过合理的努力从深度学习中获益。例如，他们可以利用预先培训的深度学习网络。为此，市场上提供了许多免费的开源解决方案。不过，使用它们还是有一些陷阱。例如，可能会出现许可证问题。通常需要几十万个样本图像来精确识别物体。之所以需要如此多的特征，是因为许多不同的特征，如颜色、形状、纹理和表面结构，对识别过程至关重要。在选择如此大量的图像时，确保它们不受开源产品很少保证的第三方权利的约束是很重要的。

使用开源工具的另一个挑战是，它们通常只单独执行某些机器视觉任务，很难集成到其他应用程序或现有框架中。典型的机器视觉问题通常涉及几个步骤。首先，必须将来自图像采集设备的数字图像数据提供给特定应用程序。然后在第二个步骤中对数据进行预处理，在该步骤中，图像被优化定向以将对象放置在所需的位置。最后，处理后的数据被集成到其他解决方案中，例如PLC，这样就可以无缝地将结果用于其他流程步骤。这就是开源系统达到其极限的地方。

标准专有软件有很多优点

已经拥有预先培训的网络的专有标准软件解决方案是机器视觉的更实用的选择。这些解决方案包括配备培训深度学习网络的所有重要功能的软件。基于其广泛的功能和专门配置的工具，它可以最佳地集成到其他应用程序中。该解决方案包括多个网络，这些网络已根据工业环境中大约一百万个精心挑选的免许可证图像进行了预先培训。公司只需要一些额外的图像就可以根据自己的特定应用定制网络培训流程。这大大减少了培训工作，节省了资金，并避免了与图像权利相关的风险。

通过深度学习，可以精确地检测物体。图像来源：MVTec Software GmbH

使用开源工具是另一个挑战。深度学习应用程序通常包含数十万行编程代码。要正确操作，此代码必须满足某些质量标准。使用一个未知社区开发的开源代码会在这方面产生一定的风险。为了安全起见，公司需要在内部检查代码以确定其质量。由于大量的代码，这项任务非常劳动密集，并且产生了几乎无法计算的成本。然而，使用专有的商业解决方案，公司可以从高质量、经过测试和安全的代码中获益。如果需要支持的话，专业顾问和专家是可以利用的，这在开放的社区中是不可指望的。

结论

在数字化时代和工业物联网时代，机器视觉是高度自动化和网络化生产过程中不可或缺的伴随技术。基于AI的技术，如深度学习和CNN，是这些机器视觉解决方案的重要组成部分。但是，请务必记住它们仅适用于某些应用程序。公司还应该仔细考虑开源系统是否足以满足他们的要求，或者是否值得花时间投资商业的专有软件解决方案。

小编推荐HOT