数据挖掘(英语:Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性(属于Association rule learning)的信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。
    数据挖掘是一种决策支持过程,它主要基于 人工智能、机器学习、 模式识别、统计学、 数据库、可视化技术等,高度 自动化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策。
     知识发现过程由以下三个阶段组成:(1)数据准备,(2)数据挖掘,(3)结果表达和解释。数据挖掘可以与用户或知识库交互。
  (以上来源:百度百科  http://baike.baidu.com/view/7893.htm)

 数据挖掘

数据挖掘领域10大挑战性问题:

1.Developing a Unifying Theory of Data Mining  ( 数据挖掘的统一理论框架的构建)

2.Scaling Up for High Dimensional Data/High Speed Streams  (高维数据和高速数据流的挖掘)

3.Mining Sequence Data and Time Series Data   (序列和时序数据的挖掘)

4.Mining Complex Knowledge from Complex Data  (复杂数据中复杂知识的挖掘)

5.Data Mining in a Network Setting   (网络环境中的数据挖掘)

6.Distributed Data Mining and Mining Multi-agent Data  (分布式数据和多代理数据的挖掘)

7.Data Mining for Biological and Environmental Problems   (生物和环境数据的挖掘)

8.Data-Mining-Process Related Problems  ( 数据挖掘过程中的相关问题处理)

9.Security, Privacy and Data Integrity   (数据挖掘中数据安全、数据所涉及到的隐私和数据完整性的维护)

10.Dealing with Non-static, Unbalanced and Cost-sensitive Data (非静态、非平衡及成本敏感数据的