data mining, machine learning and database

突然对数据挖掘和机器学习分不清了。于是查找资料。
得到的答案:目标不一样。
Data mining is the process of extracting hidden patterns from data.


Machine learning is the subfield of artificial intelligence that is concerned with the design and development of algorithms that allow computers to improve their performance over time based on data, such as from sensor data or databases. A major focus of machine learning research is to automatically produce (induce) models, such as rules and patterns, from data. Hence, machine learning is closely related to fields such as data mining, statistics, inductive reasoning, pattern recognition, and theoretical computer science.


         数据挖掘是从巨量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程. 通俗地说,现在人们已经被海量数据所淹没了,而数据挖掘则是希望帮助人们从数据中发现有用的知识. 数据挖掘中用到了大量的机器学习界提供的数据分析技术和数据库界提供的数据管理技术. 从数据分析的角度来看,数据挖掘与机器学习有很多相似之处,但不同之处也是显著的,例如:数据挖掘并没有机器学习探索人的学习机制这一科学发现任务;数据挖掘中的数据分析是针对巨量数据进行的. 从某种意义上说,机器学习的科学成分更重一些,而数据挖掘的技术成分更重一些. 目前,数据挖掘已经在欧美等发达国家得到了很多应用(由于中国的信息电子化起步较晚,数据挖掘的应用还不太多),但这个领域中需要深入研究的问题仍然非常多. 数据挖掘也是 LAMDA 的核心研究领域.


         学习能力是智能行为的一个非常重要的特征,不具有学习能力的系统很难称为一个真正的智能系统, 而机器学习则是希望使(计算机)系统能够利用经验来改善自身的性能,因此该领域一直是人工智能的核心研究领域之一。在计算机系统中,"经验"通常是以数据的形式存在的,因此机器学习不仅涉及到对人的认知学习过程的探索,还涉及到对数据的分析处理 。实际上,机器学习已经成为计算机数据分析技术的创新源头之一。由于几 乎所有的学科都要面对数据分析任务,因此机器学习已经开始影响到计算机科学的众多领域,甚至计算机科学之外的很多学科。从火星探测机器人、基因芯片到汽车自动驾驶、智能家电,机器学习都在背后发挥着重要的作用,但这个领域中需要深入研究的问题仍然非常多. 机器学习是 LAMDA 的核心研究领域。---源自LAMDA主页
数据挖掘与机器学习经典图书介绍:http://www.cc-edu.net/lanmu/JCJS/2008_09.pdf

       对于“数据挖掘”,有多种文字不同但含义接近的定义,简单来说,可以归纳为“试图从海量数据中找出有用的知识”。在学术界,有时也将“数据挖掘(DM)”称为“数据库中的知识发现(KDD)”。

      而“机器学习”是人工智能的核心研究领域之一,目前被广泛采用的机器学习的定义是“利用经验来改善计算机系统自身的性能”。

      

       南京大学的周志华教授曾专门撰文论述了数据挖掘和机器学习以及数据库之间的关系,他提出:数据挖掘可以视为机器学习和数据库的交叉,主要利用机器学习界提供的技术来分析海量数据,利用数据库界提供的技术来管理海量数据。

      组成数据挖掘的三大支柱包括统计学、机器学习和数据库领域内的研究成果,其他还包含了可视化、信息科学等内容。不同的教材从不同的方面结合其基础学科知识讲述数据挖掘技术,不同专业和技术背景的学生或数据挖掘研究人员和应用人员可以根据自身的专业方向选择不同的数据挖掘切入点。
另附周志华 《数据挖掘与机器学习》http://xinxi.xaufe.edu.cn/kejian/files/05033at2007121222135317664.pdf
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值