什么是数据分析与数据挖掘技术?
所谓的数据分析,就是对已知的数据进行分析,然后提取出一些有价值的信息,比如统计出平均数、标准差等信息,数据分析的数据量有时可能不会太大,而数据挖掘,是指对大量的数据进行分析与挖掘,得到一些未知的,有价值的信息等,比如从网站的用户或者用户行为数据中挖掘出用户潜在的需求信息等,从而对网站进行改善等。
数据分析与数据挖掘密不可分,数据挖掘是数据分析的提升。
数据挖掘的层次更深
数据分析与挖掘技术能做什么事情?
数据挖掘技术可以帮助我们更好的发现食物之前的规律。所以,我们可以利用数据挖掘技术实现数据规律的探索,比如发现窃电用户、发掘用户潜在需求、实现信息的个性化推送、发现疾病与症状甚至疾病与药物之前的规律等等。
数据挖掘的过程
1、定义目标(需求)
2、获取数据(常用的手段有通过爬虫采集或者下载一些统计网站发布的数据)
3、数据探索,就是对数据进行初步的研究
4、数据预处理(数据清洗、数据集成、数据变换、数据规约【数据精简】)
5、挖掘建模(大致四类:分类、聚类、关联、预测)
6、模型评价与发布