【机器学习】关于机器学习那些你不知道的“民间智慧”

最新推荐文章于 2024-03-31 22:34:41 发布

产业智能官

最新推荐文章于 2024-03-31 22:34:41 发布

阅读量2.3k

点赞数

机器学习算法可以通过从例子中推广来弄清楚如何执行重要的任务。

本文总结了机器学习研究人员和从业人员学到的8个关键经验教训，包括要避免的陷阱，重点问题并回答了一些常见的问题。在本文中分享了这些经验教训，因为在考虑机器学习问题时，它们非常有用。

1 - 学习=表示+评估+优化

所有的机器学习算法通常由3个组件组成：

表示法：分类器必须用计算机可以处理的一些正式语言表示。相反地，为学习者选择一个表达式就等于选择它可能学习的一组分类器。这个集合被称为学习者的假设空间。如果一个分类器不在假设空间，就不能被学习到。一个相关的问题是如何表示输入，即使用哪些功能。

评估：需要一个评估函数来区分好的分类器和坏的分类器。该算法在内部使用的评估函数可能与我们希望分类器优化、简化优化以及下一节讨论的问题不同。

优化：最后，我们需要一种方法来在语言中的分类器中搜索得分最高的分类器。优化技术的选择对于学习者的效率是关键的，并且如果评估函数具有多个最优值，则有助于确定所产生的分类器。新学习者开始使用现成的优化器（后来被定制设计的优化器替代）是很常见的。　　

2 - 泛化很重要

机器学习的基本目标是在训练集范例之外进行泛化。这是因为，无论我们有多少数据，我们都不太可能在测试时再次看到这些确切的例子。做好训练集很容易。机器学习初学者最常犯的错误就是对训练数据进行测试，并有成功的幻觉。

如果选择的分类器在新的数据上进行测试，通常不会比随机猜测更好。所以，如果你雇人去建立分类器，一定要保留一些数据给你自己，并测试他们给你的分类器。相反，如果你被雇佣来建立一个分类器，要把一些数据从一开始就放在一边，只用它来测试你选择的分类器，然后在整个数据上学习最终的分类器。

3 - 数据是不够的

泛化是目标同时还有另外一个重要的后果：不管你拥有多少数据，那都是不够的。

这似乎是一个令人沮丧的消息。那么我们怎么能学到东西？幸运的是，我们想要在现实世界中学习的功能并不是从所有数学上可能的功能集合中统一得出的！事实上，举一个非常普遍的假设，比如平滑性，类似的例子，有限的依赖性或者有限的复杂性，往往足以做得很好，这也是机器学习如此成功的很大一部分原因。就像演绎一样，归纳（学习者所做的）就是知识杠杆：将少量的输入知识转化为大量的输出知识。感应是一个比演绎强大得多的杠杆，需要更少的输入知识来产生有用的结果，但是它仍然需要超过零的输入知识来工作。而且，就像任何一个杠杆一样，我们投入得越多，我们就越能走出去。

回想起来，学习知识的需求不应该令人惊讶。机器学习不是魔术，它不能从无到有。它所做的是从更少获得更多。像所有的工程一样，编程有很多工作：我们必须从头开始构建所有的东西。学习更像是农业，让大自然完成大部分的工作。农民将种子与营养物质结合起来种植作物。学习者将知识与数据结合起来，开展项目。

4 - 有许多面临过度拟合

如果我们拥有的知识和数据不足以完全确定正确的分类器呢？那么我们就冒着对分类器（或其中的一部分）产生幻觉的风险，这些分类器并不是基于现实，而只是简单地编码数据中的随机物。这个问题被称为过度拟合，是机器学习的怪圈。当你的学习者输出的分类器在训练数据上是100％准确的，但在测试数据上只有50％准确的时候，实际上它可以输出一个75％准确度的分类器，那么，这时候它就可能显得有些过度了。

机器学习中的每个人都知道过度拟合，但它有很多形式，并不是很明显。理解过度拟合的一种方法是将泛化误差分解为偏差和方差。偏见是学习者不断学习同样错误的东西的倾向，不管真实的信号如何，方差是倾向于学习随机事物。线性学习者有很高的偏见，因为当两个类之间的边界不是一个超平面时，学习者无法诱导它。决策树却不存在这个问题，因为它们可以表示任何布尔函数，但是另一方面它们可能遭受高度的方差：由相同现象产生的不同训练集上学习的决策树通常是非常不同的，事实上它们应该是相同的。

交叉验证可以帮助对抗过度拟合，例如通过使用交叉验证来选择决策树的最佳尺寸来学习。但这不是万能的，因为如果我们用它来做太多的参数选择，它本身就会开始过度适应。

除了交叉验证之外，还有很多方法可以解决过度拟合的问题。最流行的是给评价函数增加一个正则化术语。例如，这可以惩罚更多结构的分类器，从而有利于较小的分类器，只需较少的装配空间。另一种方法是在添加新的结构之前，进行像卡方这样的统计显著性检验，以确定类别的分布是否真的不同于这种结构。当数据非常稀少时，这些技术特别有用。尽管如此，你应该对某种技术“解决”过度拟合问题的说法持怀疑态度。通过落入相反的偏差（偏差），很容易避免过度拟合（方差）。同时避免这两种情况都需要学习一个完美的分类器。

5 - 直觉在高维度失败

过度拟合之后，机器学习中最大的问题就是维度的问题。这个表达式是由Bellman在1961年提出的，指的是当输入是高维时，许多在低维度上工作正常的算法变得棘手。但是在机器学习中，它指的是更多。随着示例的维数（特征数量）的增长，泛化正确变得越来越难，因为固定大小的训练集覆盖了输入空间的一小部分。

高维的一般问题是，我们来自三维世界的直觉通常不适用于高维空间。在高维度中，多元高斯分布的大部分质量并不接近平均值，而是在其周围越来越远的“壳”中;而高维度橙色的大部分是在皮肤中，而不是纸浆。如果恒定数量的例子在高维超立方体中均匀分布，那么超越某个维度，大多数例子更接近于超立方体的一个面，而不是最近邻。如果我们通过将它写入超立方体来近似超球面，那么在高维度下，超立方体的几乎所有体积都在超球面之外。这对于机器学习来说是个坏消息，一种类型的形状常常被另一种形状所逼近。

建立二维或三维分类器很容易，我们可以通过视觉检查找出不同类别的例子之间的合理边界。但是在高维度上很难理解正在发生的事情。这反过来又使设计一个好的分类器变得困难。天真地说，人们可能会认为收集更多的功能从来不会受到伤害，因为在最坏的情况下，他们不会提供有关类的新信息。但事实上，维度的诅咒可能超过了他们的利益。

6 - 理论上的保证不是他们所看到的那样

机器学习论文充满了理论上的保证。最常见的类型是确保良好泛化所需的示例数量的界限。你应该怎样做到这些保证？首先，它们是可能的。归纳传统上与演绎相对照：在推论中你可以保证结论是正确的;在归纳中，所有投注都是关闭的。或者这是许多世纪的传统智慧。近几十年来的一个主要发展是认识到，事实上，我们可以对归纳的结果有所保证，特别是如果我们愿意为概率保证提供解决的话。

我们必须小心这是什么意思。例如，如果你的学习者返回了一个与某个特定训练集一致的假设，那么这个假设就没有这么说。现在说的是，给定一个足够大的训练集，很有可能你的学习者要么返回一个推广的假设，要么找不到一致的假设。约束也没有说如何选择一个好的假设空间。它只告诉我们，如果假设空间包含真实的分类器，那么学习者输出一个不好的分类器的概率随着训练集的大小而减少。如果我们缩小假设空间，边界就会改善，但是包含真实分类器的机会也会缩小。

另一种常见的理论保证类型是渐近的：给定无限的数据，保证学习者输出正确的分类器。这是令人放心的，但是由于其渐近的保证，选择一个学习者而不是另一个学习者会是一件轻率的事情。在实践中，我们很少处于渐近状态（也被称为“asymptopia”）。而且，由于上面讨论的偏差 - 方差权衡，如果学习者A比给定无限数据的学习者B好，则B往往比给定的有限数据好。

理论保证在机器学习中的主要作用不是作为实际决策的标准，而是作为算法设计的理解和推动力量的来源。在这方面，他们相当有用。事实上，理论与实践的密切相互作用是机器学习多年来取得如此巨大进步的主要原因之一。但要注意：学习是一个复杂的现象，只是因为学习者有一个理论上的正当理由，而且在实际工作中并不意味着前者是后者的原因。

7 - 更多数据能击败更聪明的算法

在大多数计算机科学中，这两种主要的有限资源是时间和记忆。在机器学习中，还有第三个：训练数据。哪一个瓶颈已经从十年变为十年了，在八十年代，这往往是数据，在今天往往是时间。大量的数据是可用的，但没有足够的时间来处理它，所以它没有被使用。这导致了一个矛盾：即使原则上有更多的数据意味着可以学习更复杂的分类器，但实际上更简单的分类器被使用，因为复杂的分类器需要很长的时间学习。部分答案是想出快速学习复杂分类器的方法，而且在这方面的确有了显显著的进展。

使用更聪明的算法的部分原因是有一个比你所期望的更小的回报，第一个近似，他们是一样的，当你认为表述与规则集和神经网络不同时，这是令人惊讶的。但事实上，命题规则很容易被编码为神经网络，其他表征之间也存在类似的关系。所有学习者本质上都是通过将附近的例子分组到同一个类来工作的，关键的区别在于“附近”的含义。在非均匀分布的数据下，学习者可以产生广泛不同的边界，同时在重要的区域（即具有大量训练示例的那些区域）中也做出相同的预测，大多数文本示例可能会出现）。这也有助于解释为什么强大的学习可能是不稳定的，但仍然准确。

通常，首先尝试最简单的学习者（例如，逻辑回归之前的朴素贝叶斯，支持向量机之前的k-最近邻居）是值得的。更复杂的学习者是诱人的，但他们通常也更难使用，因为他们有更多的旋钮，你需要转向获得好的结果，因为他们的内部是更不透明的）。

学习者可以分为两大类：表示具有固定大小的线性分类器，以及可以随数据一起增长的表达式，如决策树。固定大小的学习者只能利用这么多的数据。原则上可变大小的学习者可以在给定足够数据的情况下学习任何函数，但实际上由于算法或计算成本的限制，他们可能不会。而且，由于维度的诅咒，不存在大量的数据可能就足够了。由于这些原因，聪明的算法，那些充分利用数据和计算资源的算法，如果你愿意付出努力的话，往往会得到回报。设计学习者和学习分类器之间没有尖锐的边界，相反，任何给定的知识都可以在学习者中编码或从数据中学习。所以机器学习项目往往会成为学习者设计的重要组成部分，当然，从业者需要具备一定的专业知识。

8 - 学习许多模型，不局限于一个

在机器学习的早期，每个人都有自己喜欢的学习者，并有一些先验的理由相信它的优越性。大部分努力尝试了很多变化，并选择最好的一个。然后系统的经验比较表明，最好的学习者因应用而异，包含许多不同学习者的系统开始出现。现在努力尝试许多学习者的变化，仍然选择最好的一个。随后研究人员注意到，如果不是选择找到的最佳变体，我们结合了许多变体，结果会更好 - 通常要好得多 - 而且对用户来说没有额外的工作量。

现在创建这样的模型集是标准的。在最简单的技术中，称为bagging，我们通过重采样简单地生成训练集的随机变化，分别学习一个分类器，并通过投票结果结合。这是有效的，因为它大大降低了方差，而只是在提高的过程中稍微增加偏差，训练样例有权重，而且这些都是不同的，所以每个新的分类器都集中在前面那些往往会出错的例子上。在堆叠中，单个分类器的输出成为了“高级”学习者的输入，这个学习者能计算出如何最好地组合它们。

结论

像任何学科一样，机器学习有许多难以实现的“民间智慧”，但对成功至关重要。多明戈斯教授的论文总结了一些你需要知道的最重要的内容。

机器学习？人工智能？还在傻傻分不清楚？

人工智能并不是一个新的术语，它已经有几十年的历史了，大约从80年代初开始，计算机科学家们开始设计可以学习和模仿人类行为的算法。

在算法方面，最重要的算法是神经网络，由于过拟合而不是很成功(模型太强大，但数据不足)。尽管如此，在一些更具体的任务中，使用数据来适应功能的想法已经取得了显着的成功，并且这也构成了当今机器学习的基础。

在模仿方面，人工智能专注于图像识别，语音识别和自然语言处理。人工智能专家们花费了大量的时间来创建诸如边缘检测，颜色配置文件，N-gram，语法树等。不过，这些进步还不足以达到我们的需求。

传统的机器学习：

机器学习(ML)技术在预测中发挥了重要的作用，ML经历了多代的发展，形成了具有丰富的模型结构，例如：

1.线性回归。
2.逻辑回归。
3.决策树。
4.支持向量机。
5.贝叶斯模型。
6.正则化模型。
7.模型集成(ensemble)。
8.神经网络。

这些预测模型中的每一个都基于特定的算法结构，参数都是可调的。训练预测模型涉及以下步骤：

1. 选择一个模型结构(例如逻辑回归，随机森林等)。
2. 用训练数据(输入和输出)输入模型。
3. 学习算法将输出最优模型(即具有使训练错误最小化的特定参数的模型)。

每种模式都有自己的特点，在一些任务中表现不错，但在其他方面表现不佳。但总的来说，我们可以把它们分成低功耗(简单)模型和高功耗(复杂)模型。选择不同的模型是一个非常棘手的问题。

由于以下原因，使用低功率/简单模型是优于使用高功率/复杂模型：

在我们拥有强大的处理能力之前，训练高功率模型将需要很长的时间。

在我们拥有大量数据之前，训练高功率模型会导致过度拟合问题(因为高功率模型具有丰富的参数并且可以适应广泛的数据形状，所以我们最终可能训练一个适合于特定到当前的训练数据，而不是推广到足以对未来的数据做好预测)。

然而，选择一个低功率的模型会遇到所谓的“欠拟合”的问题，模型结构太简单，如果它复杂，就无法适应训练数据。(想象一下，基础数据有一个二次方关系：y = 5 * x ^ 2;你无法适应线性回归：y = a * x + b，不管我们选择什么样的a和b。

为了缓解“不适合的问题”，数据科学家通常会运用他们的“领域知识”来提出“输入特征”，这与输出关系更为直接。(例如，返回二次关系y = 5 * square(x)，如果创建了一个特征z = x ^ 2，则可以拟合线性回归：y = a * z + b，通过选择a = 5和b = 0)。

机器学习的主要障碍是特征工程这个步骤，这需要领域专家在进入训练过程之前就要找到非常重要的特征。特征工程步骤是要靠手动完成的，而且需要大量领域专业知识，因此它成为当今大多数机器学习任务的主要瓶颈。

换句话说，如果我们没有足够的处理能力和足够的数据，那么我们必须使用低功耗/更简单的模型，这就需要我们花费大量的时间和精力来创建合适的输入特征。这是大多数数据科学家今天花时间去做的地方。

神经网络的回归：

在大数据时代，云计算和大规模并行处理基础架构的共同发展，使得机器处理能力在二十一世纪初得到了极大的提升。我们不再局限于低功耗/简单的模型。例如，当今最流行的两种主流机器学习模型是随机森林和梯度提升树。尽管如此，两者都非常强大，并且提供了非线性模型拟合的训练数据，但数据科学家仍然需要仔细地创建特征以获得良好的性能。

与此同时，计算机科学家重新使用神经网络的许多层来完成这些人类模仿的任务。这给DNN(深度神经网络)带来了新的生机，并在图像分类和语音识别任务方面提供了重大突破。DNN的主要区别在于，你可以将原始信号(例如RGB像素值)直接输入DNN，而不需要创建任何域特定的输入功能。通过多层神经元(这就是为什么它被称为“深度”神经网络)，DNN可以“自动”通过每一层产生适当的特征，最后提供一个非常好的预测。这极大地消除了寻找“特征工程”的麻烦，这是数据科学家们最喜欢看到的。

DNN也演变成许多不同的网络拓扑结构，所以有CNN(卷积神经网络)，RNN(递归神经网络)，LSTM(长期短期记忆)，GAN(生成敌对网络)，转移学习，注意模型(attention model)所有的这些被统称为深度学习(Deep Learning)，它正在引起整个机器学习界的关注。

强化学习：

另一个关键组成部分是关于如何模仿一个人(或动物)的学习，设想感知/行为/奖励循环的非常自然的动物行为。一个人或者一个动物首先会通过感知他或者她所处的状态来了解环境。在此基础上，他或者她会选择一个“动作”，将他或者她带到另一个“状态”。那么他或她将获得“奖励”，循环重复，直到他或她消失。这种学习方式(称为强化学习)与传统监督机器学习的曲线拟合方法有很大不同。尤其是，强化学习学习得非常快，因为每一个新的反馈(例如执行一个行动并获得奖励)都被立即发送到影响随后的决定。

强化学习也提供了预测和优化的平滑整合，因为它在采取不同的行动时保持当前状态的信念和可能的转换概率，然后做出决定哪些行动可以导致最佳结果。

深度学习+强化学习= AI

与经典的ML技术相比，DL提供了一个更强大的预测模型，通常可以产生良好的预测结果。与经典优化模型相比，强化学习提供了更快的学习机制，并且更适应环境的变化。

超全AI产品清单，分分钟搞定你的难题！

作者：Liam Hänel

来源：大数据文摘

编译：赵逸云、蒋宝尚、钱天培

本文为大家盘点已实现产品化的商用AI，看看他们在业界都搞出些什么名堂。

人工智能席卷各行各业早已是不争的事实。

一边是大把人担心AI抢走自己的饭碗，另一边又是人工智障事故频出、难在业界落地。

AI在业界的应用程度到底如何，恐怕还得从已有的商用AI看起。

今天，我们就来盘点一下已实现产品化的商用AI，看看它们在业界都能搞出些什么名堂。

如果你真怕被AI抢走饭碗，所谓知己知彼，赶紧要来了解AI在业界的具体应用。

如果你是企业负责人，更是别错过这张清单——或许你的生产运转难题就可以被其中的某一个AI应用解决！

语音

Capio — 语言转录和识别

Deepgram — 电话、录像和在线内容的转录

Gridspace — 探索更多的顾客和职员的对话

MindMeld — 强化对话界面的高级AI

Nexidia — 把用户的交互转化为有价值的理解

Pop Up Archive — 使音频变为可搜索文档

TalkIQ — 关于客户对话的重要见解

Twilio — 给网页和APP添加信息、声音和视频模块

商业智能&分析

Arago/HIRO — IT的优化和自动化以及商业运作

Arimo —针对IoT（物联网）的行为AI

Ayasdi — 针对企业的一套智能应用软件

DataRobot —系列改进企业产品的产品

Dataminr — 在新闻公布之前发掘事件和信息

Electra by Lore — 帮助您回答关于您业务的问题

Einstein — 更智能的Salesforce

Fuzzy AI — 在网页和移动应用程序上添加智能决策

Logz.io — 帮您索引、搜索、可视化和分析您的数据

NXT AI — 时间模式识别和预测的框架

Paxata — 将原始数据自动转换为有用的信息
Poweredby.ai — 帮助您监视服务器的错误

Sundown — 自动处理您的业务中的重复性任务
UBIX — 使复杂的数据科学易于企业使用

Ruths.ai — 帮助您最大限度地使用您的数据
Exchange.ai — 分析市场
Owl.ai — 捕获、分类和提取您所有数据中的关键信息
AnswerRocket — 基于搜索的快速数据洞察
iSeek.ai — 更快、更好、更低成本地解决大数据问题
Ecosystem.AI — 在复杂的人类和商业生态系统中找到隐藏价值
Prix — 助您优化定价

核心AI

Algorithmia — 许多算法、函数和模型的通用API（Application Programming Interface,应用程序编程接口）
Arya —神经网络的工作台

CognitiveScale — 针对企业的特定领域的高级ML（机器学习）
Digital Reasoning — 针对企业的高级机器学习
Fluid AI — 针对企业的高级机器学习
H2O.ai — 开源的机器学习和深度学习平台
Loop AI Labs — 针对企业的高级机器学习
Nervana — 计算系统的深度学习
Petuum — 针对企业的高级机器学习
Scaled Inference — 针对企业的高级机器学习
Sentient — 有关金融、电子商务和数字市场的一系列AI产品
Skymind — Java虚拟机上针对企业的开源深度学习和ETL（数据仓库技术）
Vicarious — 针对企业的高级机器学习
Loom Systems — 针对企业的日志分析

PipelineAI—大规模解决ML（机器学习）和AI产品的问题
Ogma— 使用神经科学建立AI

数据捕获

Amazon Mechanical Turk — 能使简单流程自动化的人力市场
CrowdAI — 大规模自动发掘目标
Datalogue — 自动准备好随时都能立即使用的合适的数据
DataSift — 帮助构建从社交媒体到博客的数据
Diffbot —自动将网页提取为结构化数据
Import.io —从几乎任何网站提取数据

Playment — 针对企业的数据训练、图像标注等等
WorkFusion — 运营团队使业务流程自动化的工具

数据科学

BigML — 所有预测用例的单个平台

译者注（支持跨云导入数据的管理平台）

CrowdFlower — 为机器学习团队训练数据，标注图像
Dataiku —适用于大规模数据初始化、部署和运行的数据科学平台
DataScience — 用来研究、开发和生产的企业级数据科学平台
Domino Data Lab — 用来协作、构建和部署的平台
Exploratory — 使分析人员可以使用开源算法来访问DS
Kaggle —帮助您学习、工作和玩机器学习模型
RapidMiner — 使得数据科学团队更加高效
Seldon — 帮助DS团队将机器学习模型投入生产
SherlockML 一个构建，测试和部署AI算法的平台
Spark —研究能够发掘复杂数据模式的引擎
Tamr — 整合离散数据源
Trifacta — 使数据的结构更有助于分析
Yhat — 使数据科学家能够快速部署和更新预测模型
Yseop — 自动编写报告，网站，电子邮件，文章等等

发展

AnOdot — 检测业务事件
Bonsai — 开发适应性更强、可信度更高和可编程的AI模型

Deckard.ai — 帮助预测项目时间表
Fuzzy.ai — 在网页和移动应用程序上添加智能决策
Gigster — 将项目与正确的团队联系起来
Kite — 用可获得的网页知识来强化编程环境
Layer 6 AI — 用于预测和个性化的深度学习平台
Morph — 使得开发适合您业务的聊天机器人更加容易
Ozz — 帮助聊天机器人自我学习，会使其更加聪明
RainforestQA —快速的网页和移动应用测试
SignifAI —增加服务器正常运行时间以及预测停机时间
Turtle —项目管理以及易于团队使用的聊天软件

Improve.ai — 自动优化APP内容、设计和定价等
Gesture.ai — 开发者的手势识别
Cognitive Toolkit — 训练深度学习算法使能像人脑一样学习
Bonsai — 提取出复杂的机器学习库例如TensorFlow，以便更高效地管理AI模型

译者注（Bonsai总部位于加州伯克利(Berkeley)，是一个软件开发平台，允许所有开发者搭建、训练、使用智能模型。不需要复杂的AI算法和技术，Bonsai人工智能引擎能让开发人员更高效地编码，以更好地控制和优化硬件和软件。）
Tangle — 帮助设计者，工程师和领导者做决定
Imandra — 帮助分析算法

内部数据

Alation — 帮助您协同工作、提高生产力和数据索引
Cycorp — 系列不同的企业级AI产品
Databricks — 去除集群管理的弊病，让我们专注于DS(数字服务)

（译者注；该产品背后的理念是提供处理数据的单独空间，不受托管环境和 Hadoop 集群管理的影响，整个过程在云中完成。）
Deckard.ai —帮助预测项目时间表
Gavagi — 在线趋势的洞察和其他文本分析工具
IBM Watson — 商用AI平台
Kyndi — 帮助知识工作者处理大量的信息
One Factor — 针对风险管理和运营的SaaS AI
Probot — 使您的业务软件更加智能
Sapho — 帮助员工完成任务以及使用微型APP访问数据
Sofia —更好的网站分析

eContext —使非结构化数据结构化
Hayley — 创建人、设备和数据间的智能交互
RelativeInsight—深入洞察客户和内部数据
Rainbird —大规模自动化决策

机器学习

Bonsai — 发展适应性更强、可信度更高和可编程的AI模型Cycorp — 一系列不同的企业级AI产品
Datacratic — 帮助您将数字广告定位于您的目标人群
deepsense.io — 以图像，语音，文本和视频的形式分析数据
Geometric Intelligence — 目前是Uber人工智能实验室的一部分
HyperScience —能够处理琐事，为员工节省时间
Nara Logics —统一数据以获取更优推荐的平台
SigOpt — 将机器学习模型的速度提高了100倍

Amazon Machine Learn — 机器学习是其中一项服务
Providence —导入预测模型并无限缩放以回答存在的问题

传感器（物联网/工业物联网）

Alluvium — 该平台实时监控工厂的生产状况
Black —了解您商店里购物者的行为
C3 IoT — 帮助统一应用程序开发和数据科学
KONUX — 结合智能传感器及人工智能对数据进行分析
Imubit — 针对制造工艺优化的机器学习
Maana —系列关于燃料和工业的工作流程优化产品
Predix — 帮助您开发、部署和运营工业应用程序
Planet OS —帮助可再生能源公司更好地利用其数据
Sight Machine — 制造业分析
Sentenai — 使数据科学里的数据工程自动化
Snips —给您连接的产品添加一个语音助手
ThingWorx — 管理您的物联网应用的开发平台
Uptake —重点工业的一个预测平台
Verdigris — 商业建筑的智能建筑管理

文本分析/生成

Agolo — 从您的文本和信息里实时创建摘要
AYLIEN — 从您的文本和视觉资料中提取含义
Compreno — 不需要任何训练的文本分析和挖掘工作
Cortical.io — 高级语言处理
fido.ai —自动从文本中获取知识
IntroSpect by Lore — 建立用户的个人资料并更好地了解他们
Lexalytics — 可扩展的文本分析软件
Luminoso —捕获、衡量消费者行为并根据消费者反馈采取行动
MonkeyLearn — 针对自动分类文本的可扩展API
Narrative Science —针对您的数据解释出更多有用的信息
Qeep — 帮助您找出文档里的错误和不精确之处
spaCy — 基于Python的免费开源自然语言处理库
Salient — 自动化信息的提取、管理和分析
Stride — 使文本数据可理解
Textio — 帮助您提高招聘广告的撰写方式
Yseop — 自动编写报告、网站、电子邮件、文章等等

视觉

ABBYY — 添加即时文本捕获功能至移动应用程序等
Achron — 具有视觉和判断能力的自动无人机
Affectiva — 分析微妙的面部表情来识别人的情绪
Algocian — 使世界上每一台相机智能化
Angus.ai— 帮助相机检测分析视频馈送

（译者注；Angus.ai是将您现有的安全摄像机转变为新一代监控和警报工具的最佳软件平台。）
Birds.ai — 找出风力涡轮机的缺陷
Captricity — 从手写和输入的表格中提取和转换数据
Clarifai —帮助您组织媒体库
Cortica —医疗和运输行业的可视化分析
Deepomatic — 针对一系列用途和行业的图像检测
DeepVision — 品牌及脸部识别
Descartes Labs — 使得卫星图像有用
Flixsense — 第一个智能云视频平台
FotoNation —用于汽车和人体检测的计算机视觉
GrokStyle — 匹配相似的物品并给出组合建议
Haystack —面部识别
HireVue — 使用面部识别帮助您选择求职者
Lunit Inc. — 医疗数据的分析和解释
Matroid —识别不同的对象和事物
Netra —专注于社交网络的品牌识别
Orbital Insight — 卫星图像分析
Pilot AI Labs — 基于计算机视觉平台的深度学习
Planet — 使用卫星图像进行行星监测与分析
Spaceknow — 卫星图像分析
Sticky.ai — 眼神和情绪追踪平台
Valossa — 理解并描述视频内容
Vidi —主要用于工业目的的图像分析

CloudSight — 数秒内对图像的高质量理解
Irvine Sensors — 外来和有意放置物体的安全监测
Pilot.ai — 系列的智能计算机视觉技术

对话平台、聊天机器人

API.ai —用于构建对话式用户界面的高级工具

Chatfuel —无需编码创建一个Facebook聊天机器人

Comm.ai — 为网站和应用增添语音和聊天应用接口

Conversica — 帮助达成更多销售的聊天界面

EDDI — 创立、测试、部署聊天机器人

FPT AI Platform — 与终端用户进行自动化交互

Golem.ai — 供开发者使用的自然语言理解工具

Gong —分析、提升销售谈话与客户访问电话的质量

Kasisto — 金融行业的会话式AI平台

KITT.AI — 利用一个可视界面创建会话代理人

Maluuba —教会机器如何思考、推理与沟通

Massively — 搭建商业用途的聊天机器人

Meya —在一个平台上建立、培训和托管机器人

MindMeld — Siri的升级版本

Mobvoi —语音集成的智能手表

Motion AI — 聊天机器人让你事半功倍

msg.ai — 带有管理仪表盘的聊天机器人

Octane AI —帮助实现营销自动化的消息回复软件

OpenAI Gym — 适用于强化学习任务的开源用户界面

Orbit — 可以将会话式人工智能自动化的工具

Pool — 帮助你完成更多工作的私人助理

Recast — 一个可以建立、培训、部署智能机器人的协作平台

Reply.ai — 可以建立并管理你的会话策略的平台

Semantic Machines — 用于工作、旅行、购物及娱乐的会话AI

Snips — 在你的互联设备上增加一个语音助理

Servo — 全端机器人以及整合现有系统的语音

Smartly.ai— 一站式语音和聊天机器人平台

UNU.ai — 使用了集群智能（Swarm Intelligence）的聊天机器人

Unify — 电子商务聊天机器人

uTu — 多渠道机器人分析及数据管理

Wit.ai —为指定平台轻松创建基于文本或语音的机器人

Wysh — 支持支付功能的企业级规模聊天机器人

Zero AI —有助于理解意义、目的和事件背景的语音界面

Pez.AI — 支持基于语音聊天的业务

Nucleus.ai — 针对会话式AI的白标方案

Myra — 在网站上提供即时的客户服务

Ivy.ai — 高等教育领域的客户服务聊天机器人

Init.ai — 通过对话改善客户体验

Hatch — 通过Facebook Messenger实现自动化电子商务

Clinc —企业级AI会话平台

Botco.ai — 在大多数消息传送渠道上使用聊天机器人

Boost.ai —坚实可靠的虚拟商务伙伴

Bitbot.ai — 建立Facebook聊天机器人

NLU Lab — 建立不同类型的聊天机器人

Converse — 创造智慧型聊天机器人

Basket —电子商务购物聊天机器人

IBM Watson NLP —适用于高级文本分析的自然语言处理

Brndstr — 聊天机器人开发者工作室

Artificial Solutions —实现企业级别的自然语言处理与分析

Botsify — 无需编写程序即可创建聊天机器人

Hound —通过语言处理来实现产品语音功能（译者注：智能语音助手）

Kriya.ai —帮助你按需雇佣人才

Pandorabots — 快速建立聊天机器人

客户关系管理

DataFox — 更好的客户关系管理

Dynamic Yield — 一站式电子商务个性化平台

Jetlore —将消费者行为匹配至结构化的可行动数据

Kasisto — 金融行业对话式AI平台

Reifier — 管理客户、供应商及产品的主数据

Rep.ai — 跨平台的所有客户数据的中央枢纽

Takt —帮助你更全面地了解客户

Dynamo — 即时生成关于所有客户账户的见解

Augur —帮助识别使用不同设备的各类顾客

Audience.ai — 利用公开的社交媒体数据，帮助拓展受众群体

OpenDNA —生成和构建用户的心理图表和行为图谱

Maia — 去除了大数据的麻烦

Cogito — 在电话中侦查人类信息，提供在线的行为指导，以促进每一次交互的质量。

客户研究

Remesh — 通过规模化的对话与客户构建连接

Tanjo —以动画形式实时展现人物角色以及对客户进行细分

客户支持

Aaron — 客户服务机器人

ActionIQ — 一个帮助市场营销人员分析数据的平台

Brain —一个聊天机器人管理套件

Clarabridge —根据文本和反馈信息生成可执行的消费者洞察

DigitalGenius —在你的联络中心添加一层AI层（译者注；结合人工与智能的客服平台）

Eloquent Labs —将自助支持页面转化为对话形式，以减少工作量

Presence AI — 一个可以帮助处理顾客消息的、便捷的仪表盘

Spin — 保密的顾客反馈

Smith — 真实的接待员+基于机器学习过滤垃圾邮件、销售、不受欢迎的致电

Rep.ai — 跨平台的所有客户数据的中心枢纽

Wise.io — 减少票务、缩短回复时间，为代理人腾出更多时间

Zendesk — 创建有助于客户关系发展的软件

NEVA — 自动化客户服务与支持

Alterra.ai — 借助虚拟助理来增强联络中心话务员的能力

Agent.ai — 将客户支持工具以及数据库中心化

市场研究

Bottlenose — 以更少的时间管理数据、花更多的时间获取洞见

CB Insights — 为决策过程提供支持的预测行为

Enigma — 整合内外部数据

Intelligent Layer — 通过利用未发掘数据促进商业运营

Mattermark —帮助你在正确的公司里找到合适人选

Predata — 帮助你将媒体信息转化为投资的风险评估与预测

Premise —促使大公司做更有影响力的投资

Quid — 对市场规模、增长、投资首选机会的鸟瞰

Tracxn —帮助VC记录不同行业的初创企业所在的生态系统

Appier — 通过交叉屏幕营销提高营收

Dataminr — 即时发现有重大影响力的事件和新闻

市场营销

AirPR —帮助管理PR工作及媒体活动

Albert — 帮助你更好地开展市场营销活动

Amplero — AI驱动的B2C市场营销平台

Automat — 个性化、一对一地与批量客户交谈

BrightFunnel — 优化全流程客户体验之旅

CogniCor — 自动化产品查询、客户账户建立以及更多

Crystal — 为你的社交媒体和内容营销提供实时建议

Datorama — 机器学习驱动的数据整合以及AI驱动的营销情报

Lattice — 促使你发现未开发市场和潜在客户

LiftIgniter — 针对每一个用户的网页内容和电子商务进行个性化

Lucep — 帮助销售代表管理销售线索

Maik — 优化你的营销活动

ManyChat — 为你的市场、销售及支持活动创建Facebook Messenger机器人

Mintigo — 帮助预测销售机会并促进销售额增长

msg.ai — 一块用于管理社交平台消息显示的单一展示面板

Persado — 一个生成语言的内容平台，其语言具有激发行为的特性

Questions — 更快速、非侵入式的问卷调研

Radius — 帮助你在社交渠道上寻找潜在客户，与其互动，并转化为买家

ReSci — 帮助客户维护

Rock Fuel — 带来个性化广告的预测性市场活动

Prizma — 媒介内容的优化、受众分析

Creativity.ai — 360度的产品概览

Cosmos — 帮助你更好地了解客户

ATP — 提高营销绩效并简化工作流程的市场工具

Purple — 通过用户的wifi使用情况更多地了解你的客户

Boxever — 帮助生成内容并且在正确的时刻给到客户

销售

6sense — 为客户清单添加一层预测性的关于行为方面的洞见（译者注：通过分析人群的高时效性的行为数据，辨别潜在客户，同时针对既有客户群按照购买意愿做出分级，借此协助商户优化销售和市场事务，增长销售额）

Aviso — 做出可以促进销售增长的知情决策

BloomReach — 提供对在线购买者的见解（译者注：BloomReach 出品的SNAP软件把用户心仪的商品直接推送到电商主页）

Chorus.ai — 记录、总结在线会议以帮助完成项目结尾

Clari —精准预测并告知销售团队应该聚焦何处来达成目标

Collective[i] —帮助获取更高销售绩效的预测性AI

Enquire — 更好的电子商务搜索

Fusemachines — 自动勘探潜在客户、选择机会，以及更多

Eye.ai — 得到关于如何提高你的网站UX/UI设计的建议

InsideSales — 获取更相关的销售机会

Nova AI — 帮助你从客户身上获得有意义的、有用的洞见

One.ai— 由AI驱动的、基于云的CRM软件

People.ai —给予销售部门领导关于销售活动及其绩效的分析

Personify.ai — 轻松创建机器人

Roof AI — 生成房地产销售机会的聊天机器人

Salesforce Einstein —优化商业流程和促进客户交互

Sales Decision Engine — AI驱动的销售支持工具套装

Sudo —从客户数据中寻找有意义的信号

Spin — 保密的客户反馈

Tethr — 从客户电话交谈记录获取洞见

TACT — 再也不需要登录一款客户关系管理软件

Transformation —跟踪、匹配、理解用户体验

xiQ — 帮助加速销售增长，监控竞争活动，以及更多

Zensight — 针对专业销售人士的AI

Init.ai — 通过对话改善客户体验

Hydra.ai — 帮助销售领导者以最佳状态运营他们的团队

Hatch — 通过Facebook Messenger实现自动化电子商务

Pathlight — 永远联机、基于数据的，对销售运营团队的分析

Conversica — 从邮箱和其他沟通渠道里发现你的最佳销售机会

Sentient —自动调整网站设计以提高ROI

智能招聘

Entelo —整合来源于不同网站的职位候选人信息，并从中推荐合适候选人

Glider — 自动检索，匹配，评估

HiQ —提供如何与员工互动的见解和建议

HireVue — 使用面部识别来帮助你挑选合适候选人

Olivia — 优化的求职及招聘体验

Rai —帮助你联系并招募到合适候选人

Rey —将你介绍给你真正需要认识的人（工作与娱乐）

Talent Sonar — 使用一系列AI和包含其他相关手段的招聘平台

Textio — 帮助优化你的招聘广告的书写

Uncommon — 一个优化了的候选人搜寻及广告创建平台

Wade & Wendy — 帮助你找寻合适的工作和人选

Recruiting.AI—帮助招聘

团队协作

Aviva — 使得工作场所的沟通条理化

Butter.ai — 让你的全部公司知识触手可及

Cyclops — 视频会议，包括书写白板

Deckard.ai — 帮助预测项目进度

Howdy — 一个友善的、可培训的，能帮助Slack团队工作的机器人

Knowmail — 一个可以帮助你聪明地管理收件箱的邮箱助理

Plato — 团队协作平台

Talla — 自动化内部问题，管理员工需求并进行优先排序

Soapbox — 通向组织群体智慧的入口

x.ai — 会议议程规划助理

Yva.ai — 帮助你跟踪管理重要工作任务的私人助理

Entropy —帮助测量、提升员工的情商

ConferAI —促使员工对项目与会议有效性给出反馈

Collaboration.ai —帮助提高团队协作与绩效

Cerb — 帮助管理共享收件箱

Butterfly.ai —将员工反馈意见转化为个性化的管理者领导力培训

Butter.ai — 让你的全部公司知识变得触手可及

Brand.ai — 消除在设计与开发工作流程中的通信费用与版本冲突

原文链接：

https://medium.com/imlyra/a-list-of-artificial-intelligence-tools-you-can-use-today-for-businesses-2-3-continued-21bf14280250

https://medium.com/imlyra/a-list-of-artificial-intelligence-tools-you-can-use-today-for-personal-use-1-3-7f1b60b6c94f

人工智能赛博物理操作系统

AI-CPS OS

“人工智能赛博物理操作系统”（新一代技术+商业操作系统“AI-CPS OS”：云计算+大数据+物联网+区块链+人工智能）分支用来的今天，企业领导者必须了解如何将“技术”全面渗入整个公司、产品等“商业”场景中，利用AI-CPS OS形成数字化+智能化力量，实现行业的重新布局、企业的重新构建和自我的焕然新生。

AI-CPS OS的真正价值并不来自构成技术或功能，而是要以一种传递独特竞争优势的方式将自动化+信息化、智造+产品+服务和数据+分析一体化，这种整合方式能够释放新的业务和运营模式。如果不能实现跨功能的更大规模融合，没有颠覆现状的意愿，这些将不可能实现。

领导者无法依靠某种单一战略方法来应对多维度的数字化变革。面对新一代技术+商业操作系统AI-CPS OS颠覆性的数字化+智能化力量，领导者必须在行业、企业与个人这三个层面都保持领先地位：

重新行业布局：你的世界观要怎样改变才算足够？你必须对行业典范进行怎样的反思？
重新构建企业：你的企业需要做出什么样的变化？你准备如何重新定义你的公司？
重新打造自己：你需要成为怎样的人？要重塑自己并在数字化+智能化时代保有领先地位，你必须如何去做？

AI-CPS OS是数字化智能化创新平台，设计思路是将大数据、物联网、区块链和人工智能等无缝整合在云端，可以帮助企业将创新成果融入自身业务体系，实现各个前沿技术在云端的优势协同。AI-CPS OS形成的数字化+智能化力量与行业、企业及个人三个层面的交叉，形成了领导力模式，使数字化融入到领导者所在企业与领导方式的核心位置：

精细：这种力量能够使人在更加真实、细致的层面观察与感知现实世界和数字化世界正在发生的一切，进而理解和更加精细地进行产品个性化控制、微观业务场景事件和结果控制。
智能：模型随着时间（数据）的变化而变化，整个系统就具备了智能（自学习）的能力。
高效：企业需要建立实时或者准实时的数据采集传输、模型预测和响应决策能力，这样智能就从批量性、阶段性的行为变成一个可以实时触达的行为。
不确定性：数字化变更颠覆和改变了领导者曾经仰仗的思维方式、结构和实践经验，其结果就是形成了复合不确定性这种颠覆性力量。主要的不确定性蕴含于三个领域：技术、文化、制度。
边界模糊：数字世界与现实世界的不断融合成CPS不仅让人们所知行业的核心产品、经济学定理和可能性都产生了变化，还模糊了不同行业间的界限。这种效应正在向生态系统、企业、客户、产品快速蔓延。

AI-CPS OS形成的数字化+智能化力量通过三个方式激发经济增长：

创造虚拟劳动力，承担需要适应性和敏捷性的复杂任务，即“智能自动化”，以区别于传统的自动化解决方案；
对现有劳动力和实物资产进行有利的补充和提升，提高资本效率；
人工智能的普及，将推动多行业的相关创新，开辟崭新的经济增长空间。

给决策制定者和商业领袖的建议：

超越自动化，开启新创新模式：利用具有自主学习和自我控制能力的动态机器智能，为企业创造新商机；
迎接新一代信息技术，迎接人工智能：无缝整合人类智慧与机器智能，重新
评估未来的知识和技能类型；
制定道德规范：切实为人工智能生态系统制定道德准则，并在智能机器的开
发过程中确定更加明晰的标准和最佳实践；
重视再分配效应：对人工智能可能带来的冲击做好准备，制定战略帮助面临
较高失业风险的人群；
开发数字化+智能化企业所需新能力：员工团队需要积极掌握判断、沟通及想象力和创造力等人类所特有的重要能力。对于中国企业来说，创造兼具包容性和多样性的文化也非常重要。

子曰：“君子和而不同，小人同而不和。” 《论语·子路》云计算、大数据、物联网、区块链和人工智能，像君子一般融合，一起体现科技就是生产力。

如果说上一次哥伦布地理大发现，拓展的是人类的物理空间。那么这一次地理大发现，拓展的就是人们的数字空间。在数学空间，建立新的商业文明，从而发现新的创富模式，为人类社会带来新的财富空间。云计算，大数据、物联网和区块链，是进入这个数字空间的船，而人工智能就是那船上的帆，哥伦布之帆！

新一代技术+商业的人工智能赛博物理操作系统AI-CPS OS作为新一轮产业变革的核心驱动力，将进一步释放历次科技革命和产业变革积蓄的巨大能量，并创造新的强大引擎。重构生产、分配、交换、消费等经济活动各环节，形成从宏观到微观各领域的智能化新需求，催生新技术、新产品、新产业、新业态、新模式。引发经济结构重大变革，深刻改变人类生产生活方式和思维模式，实现社会生产力的整体跃升。

产业智能官 AI-CPS

用“人工智能赛博物理操作系统”（新一代技术+商业操作系统“AI-CPS OS”：云计算+大数据+物联网+区块链+人工智能），在场景中构建状态感知-实时分析-自主决策-精准执行-学习提升的认知计算和机器智能；实现产业转型升级、DT驱动业务、价值创新创造的产业互联生态链。

长按上方二维码关注微信公众号： AI-CPS，更多信息回复：

新技术：“云计算”、“大数据”、“物联网”、“区块链”、“人工智能”；新产业：“智能制造”、“智能金融”、“智能零售”、“智能驾驶”、“智能城市”；新模式：“财富空间”、“工业互联网”、“数据科学家”、“赛博物理系统CPS”、“供应链金融”。

官方网站：AI-CPS.NET

本文系“产业智能官”（公众号ID：AI-CPS）收集整理，转载请注明出处！

产业智能官

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【机器学习】关于机器学习那些你不知道的“民间智慧”

机器学习算法可以通过从例子中推广来弄清楚如何执行重要的任务。本文总结了机器学习研究人员和从业人员学到的8个关键经验教训，包括要避免的陷阱，重点问题并回答了一些常见的问题。在本文中分享了这些经验教训，因为在考虑机器学习问题时，它们非常有用。1 - 学习=表示+评估+优化所有的机器学习算法通常由3个组件组成：表示法：分类器必须用计算机可以处理的一些正式语言表示。相反地，为学习者选择一个表达式就等于选择
复制链接

扫一扫