由于人工智能的爆炸式增长,我们看到了解决各种问题的新技术的爆发。虽然这是一个净积极因素,但这会导致人工智能团队在如何最好地解决问题方面存在很多困惑。
这篇文章的灵感来自我与客户的许多讨论。我最常遇到的问题之一是我如何选择正确的工具来完成这项工作。今天,我将讨论我在提供解决方案时在传统人工智能、监督机器学习和深度学习之间进行选择的框架。虽然这不是一门精确的科学,但一些一般的启发式方法可以很好地作为指南。这是我对各种技术的评价——
- 传统 AI - 最安全、最易理解和最高性能。然而,传统人工智能的良好实现需要我们定义系统背后的规则,这使得其他两种技术蓬勃发展的许多用例变得不可行。
- 监督式机器学习- 黑白 AI 和深度学习的中间道路。当我们对系统的运作有一定的了解,但无法为它创建具体的、定义明确的规则时,这很好。
- 深度学习- 由于不透明且成本高昂,太多的团队急于使用深度学习,而其他解决方案就足够了。然而,对于非常非结构化的数据,识别规则和关系非常困难(甚至不可能)。在这里,深度学习可能是唯一的出路。
其中一个并不比另一个好。它们也不是相互排斥的。即使在现代 AI 管道中,正则表达式、概率分布和聚类等传统 AI 技术也被用于数据提取、特征工程和管道监控,从而能够有效部署机器学习和深度学习。
人工智能、机器学习和深度学习有什么区别
实际上,DL是ML的一个子类,ML是AI的一个子领域。人工智能本身就是一个巨大的领域,包含从if语句集合到复杂的进化算法和自组织系统的所有内容。但对于本文,以下是我们如何区分这些技术。
传统的人工智能系统是通过分析系统并围绕它创建规则来开发的。这些规则是明确编程的,大大提高了系统的透明度。这些系统在计算上也很高效,因为没有昂贵的训练过程,但是,由于这些规则必须在运行系统之前定义,因此传统的人工智能往往在适应范围内受到阻碍。在非常复杂(或高维)系统中,推断变量之间的规则/关系可能是不切实际的或不可能的。这就是 ML 的用武之地。机器学习工程师为机器提供大量数据,并让机器自行制定规则。
机器学习之所以脱颖而出,是因为它满足了信息时代的许多要求——
- 廉价的计算、大量的数据使训练机器学习系统变得可行。
- 人类专家的时间很昂贵,因此付钱给他们尝试识别非常复杂的规则并不总是有意义的。
深度学习只是更进一步。传统的 ML 依赖于特征提取,这在所有用例中都可能是不可能的。例如,当我从事 Deepfake 检测工作时,我真的很难手动提取与 Deepfakes 相关的功能。这就是 DL 的伟大之处。
深度学习使该过程的大部分特征提取部分自动化,消除了一些所需的手动人工干预......深度学习模型需要更多的数据点来提高准确性,而机器学习模型依赖于较少的数据,因为它的基础数据结构。
有了这个解释,现在让我们看一些变量,这些变量可用于确定每个变量的来源。首先从数据的可用性开始。
数据的可用性
如果无法获得高质量和大量数据,ML 和 DL 通常不可行。当数据稀缺时,传统的人工智能系统是唯一可以有效工作的解决方案——假设你拥有创建规则的领域专业知识。
对于无法创建显式规则的非常复杂的系统怎么办?我在这里的第一反应是考虑放弃并找到更好的方法来消耗你的资源。这可能说起来并不感性,但并不是每个问题都可以通过自动化决策来解决。也不应该。有时最好将想法留待以后再提出。太多的团队犯了一个错误,就是对这项技术过于关注,而没有充分考虑它是否真的是一个好主意。
可以说,拥有大量高质量的数据使ML和DL变得可行,但这并不总是意味着我们需要使用它们。您可能会发现投资回报率不值得。这就是您需要对产品和工程团队进行强有力的协调的地方,以创建有意义的基线和截止点。
对域名的理解
下一个要考虑的因素是你对领域的理解。要创建有效的规则,您需要深入了解您的系统。如果你对你的系统有很好的了解,那么传统人工智能将给你惊人的性能。以 NetHack 挑战赛中的这段冗长(但非常有见地)的名言为例,我们看到各种自动化代理对峙以击败游戏。有趣的是,挑战是由符号 AI 而不是 RL 代理主导的——
如果没有良好的领域理解,你就是在浪费时间在传统的人工智能上。这是人工智能系统的一个缺点,因为领域专家提供输入的时间和开发人员将这些输入转化为规则的时间都非常昂贵。试图为非常复杂(或混乱)的系统制定规则是一场噩梦。这就是 ML 的用武之地。
机器学习可以显著减少开发系统所需的专家时间。领域专家的见解可以快速转换为特征,然后将其提供给模型。这些功能充当模型的指南,告诉它什么是重要的,而不需要我们显式地对关系进行建模。机器会为我们做这件事。
如果你对领域没有了解,那么深度学习就会成为你的好朋友。视觉和语言就是这方面的完美例子。为这些任务提供良好的功能是一场噩梦(我们有大量数据)。因此,DL可以去brrr并解决问题。
LSTM 在击败信号干扰方面能够优于特征工程 + 神经网络。对于非常非结构化/复杂的数据,深度学习可以创造奇迹。
如果你也对人工智能感兴趣,那么这份我整理出来的人工智能资料一定可以让你快速成长:
1:人工智能详细学习路线图
2:Python数据分析与机器学习书(代表作)
3:PyTorch深度学习实战书籍
3:机器学习算法+深度学习神经网络基础教程
4:论文指导,职业规划和技术问题解答
可以关注我的公-众-号【迪哥谈AI】回复333Z 无偿获取