机器学习和数据挖掘的区别
数据挖掘有几种不同的概念定义:
数据挖掘是从大量数据中抽取挖掘出未知的、有价值的模式或规律等知识的复杂过程。
数据挖掘,又称为数据库中知识发现(Knowledge Discovery of Database,KDD),它是一个从大量数据中获取有效的、新颖的、潜在有用的、最终可理
解的模式的非平凡过程。
数据库的知识发现:数据库—>目标数据—>(数据预处理)—>变换后的数据—>(data mining)—>模式评估—>knowledge
数据的预处理过程:数据的清洗(清除与数据挖掘没有关系的数据以及与挖掘主题没有没有关系的数据)。
数据集成:将来自多个数据源的相关数据组合到一起。
数据转换:将数据转换成为易于进行数据挖掘的数据存储形式。
数据挖掘:它是知识挖掘的一个步骤,作用是利用智能方法挖掘数据模式或规律知识。
模式评估:根据一定的标准从挖掘结果中筛选出有意义的模式知识
人的智慧中一个很重要的方面是从实例中学习的能力,通过对已知事实的分析总结出规律,预测不能直接观测的事实。在这种分析和学习中,利用学习得到的规律,不但可以较好的解释已知的实例,而且能够对未来的现象或者无法直接观测的现象做出正确的预测和判断。这种能力被称为推理学习的能力。
机器学习研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。