数据挖掘和机器学习的区别与联系

关注机器学习(Machine Learning)和数据挖掘(Data Mining)有一段时间了,对两者的关系还是有一些模糊。今天参考了一些人的文章和博客,大概领会了一些东西,现在总结一下。

ML算是AI的一部分,并且更加偏重于统计和优化,很多ML的研究都非常的偏向理论。而DM可以称得上是个实用的东西,简单说就是有很多数据很多变量,我们想挖掘出我需要的信息,所以有时候人们用practical machine learning来指代DM。

我们可以理解为ML为DM提供了部分得理论基础,很多DM的问题可以用ML的算法来解决,像我所知道的Facebook和LinkedIn进行大规模的数据挖掘工作时,使用的都是很基本的ML算法。

但是DM所用的东西远不只是ML,相反有很多非常heuristic的算法,比如association rule(http://en.wikipedia.org/wiki/Association_rule_learning)。另外DM由于通常都是跟很大规模的数据打交道,所以如何高效的储存,索引(各种树结构,网格结构,LSH)数据也是DM研究的一个重要方向。

个人感觉DM只是ML的一个应用。ML是一个更general的领域,它的理论可以被用在许多地方,如DM,Computer Vision, NLP等等。对于这些不同的应用,主要表现就是对于ML算法的input和output不同。如过应用是DM的话,可能可以是电子商务平台的用户买卖记录作为输入;而对于CV而言,可能是图像中的特征点作为输入。当然如DM之流能够成为一个新的分支,必然会在其自身领域产生出新的更适合的新算法。

但总的来说,硬要说DM和ML是啥关系的话,我只能说DM应用了很多ML的算法,而ML为DM提供了更为general的理论基础。DM应用中,除了ML算法,也有很多其他的算法。




参考链接1

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值