一丶 一般情况下,数据挖掘经过如下阶段
1,数据记录到数据源中,如(文本文件,传统的业务数据系统,和其他各种数据源)
2.这些数据经过ETL(extract,transform,load)过程存储到数据仓库中,如hive(这些数据仓库并不存储数据,只是在文件系统上的存储仓库引擎,数据存储到文件系统中,如hdfs)
3,在这些数据仓库上进行随机查询等,结果存入如hbase等,hbase是类似于非关系型数据库
4.利用这些数据进行分析等,属于数据应用(前端展示)
二。OLAP(Online Analytical Processing)与OLTP(On-Line Transaction Processing)