数据科学：机器学习VS. 基于规则的系统

最新推荐文章于 2023-07-24 01:09:09 发布

张某人ER

最新推荐文章于 2023-07-24 01:09:09 发布

阅读量6.3k

点赞数 1

分类专栏：机器学习文章标签：机器学习规则系统

机器学习专栏收录该内容

17 篇文章 0 订阅

订阅专栏

数据科学：机器学习VS. 基于规则的系统（规则系统）

作者：Karthik Guruswamy, TERADATA

原文地址：

http://www.forbes.com/sites/teradata/2015/12/15/data-science-machine-learning-vs-rules-based-systems/#2715e4857a0b2c12cec35be6

译者：张某人ER

博客地址：http://blog.csdn.net/xinxing__8185

在过于的25年中，开发者在传统数据仓库上建立基于内嵌规则的实际操作模型。对于领域专家和顾问来讲，（数据（业务）中的）规则是相对容易归纳并易于开发的，只要依赖于他们的经验，并按其最佳实践，即可编码实现自动化的决策。

对于一个正在运行的系统，当有100个应用场景时，就需要写100条规则来应对。随着时间的推移，增长的需求，将需求更多的规则。这种方式的弊端是什么？想想税收法规和其它的规章制度！事情会变得庞大而笨重，尤其是我们已经跟不上数据的变化及其带来的规则的改变时。

在现行的遗留系统上，很少会有人能够真正的了解或是衡量其上的规则是否有效，或是其他规则例外的数目。无论是在归属服务【注释1】、反欺诈、网络安全等领域，在面对大数据（volume 数据量大velocity增长速度快 complexity and variety 数据复杂而具有多样性）时，传统的基于规则的系统则变得捉襟见肘。

用什么来替代基于规则的系统？

如果所有的情形都是已知的，遇到何种情形便有相应的应用决策，那么基于规则的系统会很高效地运行。在过去，由于数据相对结构化和约束性，所以制定规则相对容易。而如今，数据更加趋向于多结构化和无结构化。全面的规则制定变得不再那么可行了。

机器学习出现了。如果将数据分为二类------好和差，或分类为A,B,C,D等类别，机器学习算法能够辅助建立其中的规则。这一步叫做训练，而训练的结果是建立模型。而后，预测算法将会使用模型来分类未知数据，并作出合理的决策制定。

评价（Evaluation）vs 评分（Scoring） ----- 确定的（deterministic） vs 概率的（Probabilistic）