数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论从而对数据加以详细研究和概括总结的过程。
数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。
数据分析的目的是把隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来,总结出所研究对象的内在规律。它能帮助管理者进行判断和决策,以便采取适当策略和行动。
数据挖掘是一决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的模式,可帮助决策者调整市场策略,减少风险,做H{正确的决策。数据挖掘是通过分析每个数据,从大量数据中寻找其规律的技术。
数据挖掘和数据分析都是从数据中提取一些有价值的信息;都需要懂统计学知识,懂数据处理一些常用的方法,对数据的敏感度比较好。
两者有很多相似之处,联系越来越紧密,很多数据分析人员开始使用编程工具进行数据分析,如Python、R语言等,而数据挖掘人员在结果表达及分析方面也会借助数据分析的手段。但是两者的侧重点和实现手法有区别,不同之处表现在:
(1) 在应用工具方面
数据挖掘一般要通过算法编程来实现,需要掌握算法设计和编程语言,重在算法;而数据分析更多的是借助分析T具进行,也可通过编程实现,如Python数据分析。
(2) 在行业知识方面
数据分析要求对所从事的行业有比较深的了解和理解,并且能够将数据与自身的业务紧密结合起来;而数据挖掘不需要有太多的行业专业知识。
(3) 在交叉学科方面
数据分析需要结合统计学、营销学、心理学以及金融、政治