系统性创新，正成为AI变革智能制造的新动能-CSDN博客

本文探讨了人工智能在复杂制造业中的应用挑战，特别是深度学习的机器视觉系统。思谋科技分享了他们在计算成像、小数据智能、AutoML和边缘智能等领域的技术进展，强调了系统性技术创新和产品架构在智能制造中的重要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

作者 | 吕江波责编 | 梦依丹

出品 | 《新程序员》编辑部

智能制造作为人工智能的重点落地领域，近十年来被寄予了极高期待。然而，在生产流程更为复杂、技术安全要求更高的制造业中，人工智能很难作为单一技术实现生产的全方位整合，往往需要多技术复合能力和系统创新能力，覆盖生产制造整个流程，贯穿设计、生产、管理、服务等环节。通过体系化技术升级，制造过程才能实现智能化，达到自感知、自学习和自执行。

近年来，人工智能取得了很大的进步。从2016年横空出世的AlphaGo，到2022年年底引爆互联网的ChatGPT，人们逐渐认识到，人工智能将无处不在，正在影响各行各业和我们的日常生活。

在制造领域也是如此。自《中国制造2025》等指导文件制定后，企业对数字技术应用的认知大幅提升，我国智能制造行业保持着快速发展。以机器视觉和深度学习为代表的技术在产业中的应用逐渐深入，尤其是在工业质检、高端制造等场景中受到越来越多的青睐。

但与此同时，要想进一步推进基于深度学习的机器视觉系统在工业制造领域的落地，打造出色的工业智能系统则还面临很多挑战。

2019年，思谋科技成立。在创业过程中，我们对以AI为代表的硬科技如何应用于智能制造产业，逐渐形成了清晰和深刻的思考，并据此布局和构建公司的产品技术和业务服务体系。在这里，将我们的思考与经验分享给大家。

在智能制造领域，期待AI技术实现哪些突破？

与金融和企业软件等行业相比，工业制造业在实施数据驱动的人工智能解决方案方面挑战相对更多，难度通常更大，这其中有很多原因。

例如，工业制造领域的数据极度短缺，产品形态多变且场景复杂，算法模型的训练成本高；大多数工业系统的控制速率在毫秒级，再加上安全与隐私方面的考虑，制造环境中的AI计算通常需要在边缘设备中执行；此外，工业制造流程复杂，需要多领域的通力协同，为技术的实施增加了难度。

结合业务场景，我们认为当人工智能应用于工业制造时，还有不少值得关注和持续创新的系统性研发方向，如计算成像、小数据智能、AutoML、边缘智能与适应性模型加速技术、智能机器人等，下面我们分别具体介绍。

计算成像

精准成像就像人的眼睛一样，是感知与视觉计算的前提，制约着算法的应用范围。计算成像是融合光学硬件、图像传感器和算法软件于一体的成像技术，突破了传统成像技术信息获取的瓶颈。在复杂的工业制造领域，计算成像技术可以解决不少成像难题，在信息获取能力、成像功能、核心性能指标上带来显著提升。

目前，我们在面向计算成像的光度立体视觉、多光谱成像等方面都进行了深入的研究和应用。例如，我们开发的高速2.5D工业成像系统，核心成像算法部分包含了光度立体视觉算法，如最经典的朗伯光度立体法，通过多角度光源下成像的2D图像估算物体几何，有效提取物体表面的形状信息，然后依据下游任务，通过图像增强的后处理算法，对结果进行信息增强和信息提取。该系统在富有挑战的工业场景下进行充分验证，获得了优异的结果，能稳定成像出深度或宽度不小于0.5mm 的缺陷。

小数据智能

在精准成像基础上，机器需要“认识”大千世界，“理解”万事万物。为了达成这种识别能力，业界运用大数据和大模型都取得了飞跃性的进步，但在面对工业制造这样的传统行业时，直接的应用仍有许多困难。其中一方面原因在于：很多传统企业没有办法收集大量的特定数据来支撑AI的训练，而且不同场景存在样本不均衡问题。

未来 AI 在制造业的应用趋势之一是小数据智能，通过少量样例数据发现规律和模式，提高工业数据效率和准确性，满足多样化的制造场景，就像人类能够通过少量例子进行快速学习一样。

目前，小数据的潜力正在被业界所重视，处理方法已经越来越丰富，如小样本学习、迁移学习、自监督学习、数据合成等。这一块，我们已研发了如环境感知遮罩(Context-aware Prior Mask) 和环境感知原型学习 (Context-aware Prototype Learning)等方法，均能有效提升模型对于全新类别极少量样本的学习和定位能力。

AutoML

自动化的处理与优化能力是 AI 应用中的另一个挑战。以往的AI模型开发表现为智力密集型，需要具备丰富的专业知识和大量的时间来生成合适的模型。自动化机器学习 AutoML，则是将AI模型开发过程中耗时的重复性任务进行自动化实现的过程。相比之下，AutoML 可以简化算法模型开发流程，只需要少量代码就能生成模型，使工作变得更轻松高效。

制造业场景复杂，需要不断更新和优化 AI 模型，通过 AutoML 可以实现更加快速的模型自动化训练，使得不具备 AI 算法背景的人员也能轻松使用机器学习来解决问题、提升效率。AutoML 有望实现普惠人工智能的愿景，也能帮助工业制造产业解决人才缺乏的问题。

边缘智能与适应性模型加速技术

工业领域由于隐私保护、实时性、可靠性等方面的考虑，往往需要在边缘侧具备很强的计算和智能化能力，以便交付最佳的终端设备解决方案。

边缘智能涉及更强的计算、存储、数据传输、安全的边缘网络等技术，而 AI 软件方面的一个重要方向是适应性模型加速技术，也就是在不影响模型精度、大大降低对硬件的需求度的情况下，提升模型运行速度。

目前，我们探索了多个维度来提升模型运行速度，包括神经网络搜索、知识蒸馏、网络量化等。针对知识蒸馏，提出了基于温习的蒸馏方式和基于知识图的蒸馏方式；在神经网络搜索上，设计了全新的搜索空间，并与知识蒸馏技术相结合，保持精度的同时压缩模型大小；在网络训练完成后的量化中，针对工业场景设计了特殊的校准方式和微调技术。

智能机器人

智能机器人是包括了机械、电子、控制等多种先进技术的综合体，是很多场景下实现智能制造的核心。如果说机器视觉是“眼睛”，那机器人则可以看作是机器视觉的“手”，两者结合，才能深入改造工业制造，这也是我们开发自己的软硬一体化设备的重要原因。

智能机器人在智能制造中应用广泛。其中，与深度学习等技术结合，可以具备准确的感知和决策能力，从而更好地理解和适应复杂环境；通过自然语言交互、多模态感知技术，可以与人类协同工作，例如在生产线上，机器人可以听取指示，使用摄像头和传感器感知周围环境，并根据指示进行精确操作，完成检测、识别、抓取、对位和装配等任务。

智能制造需要什么样的技术？

然而，仅通过 AI 技术的进步赋能制造业足够吗？根据我们的经验，越是深入工业制造，就越会发现，制造产业细分门类多、工艺流程复杂、专业知识要求高。AI 算法只是解决方案中的一个组成，材料、方法、环境等因素，都可能成为关键，而这些问题会给纯软件的人工智能企业带来不小的挑战。

以在智能工业质检中应用广泛的视觉模型为例，除了模型性能，能够在资源受限的平台上最大化算法的效能和表现也很重要。有时候，视觉检测的前置条件——有效成像，更是重要环节。

我们曾为一家全球顶尖光学厂商设计镜片隐形二维码识别设备(这属于产品质量追溯的重要环节) ，需要在曲面类型多样的玻璃镜片上准确识别码点直径只有 0.125mm的隐形二维码。这不是一个视觉识别算法那么简单，其中的技术问题难倒了这家光学厂商的几乎所有供应商和许多工业视觉公司。

我们最终的解决方案，不仅涉及视觉算法，其中最为关键的一环，是研发设计了一种特殊的膜材料。因为在识别镜片隐形二维码时，需要镜片的膜材料将光源分解为一束束直径比125μm还小的光束，隐形二维码才能显现出来，而膜的厚度与折射率等都会影响光的传播，某些角度下甚至可能在膜里产生全反射，导致二维码无法被检测。

为此，我们花了不少时间与精力，研究推理膜材料的加工原理，购买各种原材料进行验证，最终选择了一种多面体微钻石结构的光源反射膜，它能兼容不同曲率、不同折射率的镜头，使光束能从不同的方向平行射出，以便稳定成像并识别。

通过以上案例，我们想问，究竟该如何理解智能制造？简单来说，它是让制造拥有思考的大脑，需要用到人工智能、ICT 技术，并且需要覆盖生产制造的整个流程，贯穿设计、生产、管理、服务，通过新的体系化的技术升级，让制造过程最终能够实现智能化，达到自感知、自学习和自执行。

在整个体系中，真正要达到解放人力、提升制造效率，需要的是跨学科融合与系统创新，涉及硬件设计、机械、自动化、电子、光学等多个学科领域。革新制造业， AI 技术的突破是关键，但它更是一个系统性创新过程，只有构建完整的技术和产品的体系化能力，才能服务好智能制造。

系统性的技术创新和产品架构

在发展的过程中，我们构建了包括软件与数字化系统、智能传感器、智能一体化设备的产品体系。结合工业领域的视觉检测场景，接下来我们将从精度、速度与稳定性三大方向来做进一步分享。

高精度方向

工业视觉检测不仅要求机器视觉系统给出定性的描述，还有着非常苛刻的量化标准，这就要求智能系统达到特定的精度，其中主要包括以下两点：

高精度测量。工业场景对生产出来的产品尺寸有着严格要求，尤其对于精密器件，一旦尺寸出现偏差，就会出现产品功能不良，导致生产停滞。在智能检测中，需要精准测量出产品的核心尺寸要求，对不良品进行预警，其中包括2D和3D场景的器件尺寸测量、器件距离测量、平整度测量等测量功能。
高精度识别。除高精度测量外，工业企业要求的识别精度也特别高，且同样面临各种现实挑战。例如，AI 模型通常需要通过充足样本来完成训练，但在工业制造领域中，实际生产中的数据样本存在长尾现象，需要使用数据增广等技术来解决数据量不足的问题，同时应用正则化技巧进一步避免模型的过拟合。所需识别的缺陷图片和正常图片之间差异小也是一个重要的问题，需要新应用采用细粒度分类等方法来解决，并研发新的损失函数和特征提取层来更好地识别不明显的缺陷。

速度方向

多轴联动技术：传统视觉检测设备通过往复搬运的方式将产品搬到不同检测工位，用不同安装角度的相机检测产品不同位置，因此检测一个产品需要多次搬运，设备检测速度较慢。如果要提升检测效率，需要采用多轴联动技术，可通过一次装夹，一套视觉系统实现多面检测。
高柔性立体视觉系统：针对一般工业产品和元器件，要实现360º全方位无死角的视觉检测，就需要灵活立体的视觉系统，并结合高速、高精度的多轴联动运动控制系统，这样才能快速获取立体工件任意表面和任意位置的细节图像。

稳定性方向

稳定性的重要性不言而喻，稳定的工业互联网环境是顺利实现智能制造的前提，这一块也有很多值得提升的方向。

扩展性强的分布式集群架构：工业现场复杂，需要有弹性能力在请求高峰期可增加计算服务数量来应对突发流量，还可为业务应用提供自我修复能力。同时也需要支持增加节点扩展部署规模等操作，便于在必要时刻扩展平台能力，提高系统稳定性。可扩展的分布式集群架构是这些需求的技术支撑。
强化稳定性的设备设计、仿真、控制、测试等技术：在工业检测设备中，针对多轴仪器高频率的启动、停止、加减速的工况，需要精确的控制方式，实现多轴运动姿态的自由调整和排序。分析高速运动下，仪器各轴关键零部件的位移、应变状态，要有独特的设计与分析方法。为了解检测设备和智能传感器在高强度工况下的稳定性，要事先模拟它们在连续工况的老化测试和振动测试。强化稳定性的设备设计、控制、仿真等技术，对系统的成败至关重要。

硬科技的范畴在不断扩展。从我们的经验看，很多技术只要深入挖掘、深度融合，就能发现一些令人惊喜的可能。这也是我们在智能制造行业不断积累新动能，提质增效的重要推手。

总结

人工智能在工业制造中的落地是一个科学与工程不断探索的过程，不仅需要先进的软件算法，还要深谙工业制造的流程，掌握多学科、懂机理、能实现的技术。这种系统化的能力，才是智能制造企业的核心竞争力与门槛。

当系统性的硬科技创新成为变革新动能，就会让智能制造处于现在进行时状态，不断提升、不断完善。它值得每一位有志者持续深耕、精进，共同实现更加智能、高效、安全和可持续的生产方式。

感谢这个时代，让我们发现了智能制造业中存在的大量机会，以及值得我们投入去改变、突破的一些事情。我们也很高兴能参与到这个澎湃的大潮中，成为行业发展的新兴力量。

作者简介

吕江波，思谋科技联合创始人兼首席技术官(CTO) 。广东省引进海外高层次人才，华南理工大学兼职教授。曾任美国 UIUC大学新加坡ADSC研究院高级科学家，领导多个项目的基础研究与场景应用。已发表约100篇国际学术论文，拥有80+已授权的国内外发明专利。曾获IEEE权威期刊最佳编委奖、首届DEMO Asia大会DEMOguru奖、 ICCVW’09最佳论文奖。