数据仓库的基本架构
这篇文章对数据仓库的基本架构讲的挺好https://blog.csdn.net/Luomingkui1109/article/details/91349121
数据统计,数据分析和数据挖掘的关系
摘自《网站分析实战》书籍
- 数据统计
数据统计更偏向于描述数据的形态和特征,一般统计学开始讲解的都是数据特征描述和数据分布,之后就会涉及假设检验、方差分析、相关分许、回归分析等,这些方法基本都定位在数据本身,很少上升到具体问题的层面。 - 数据分析
注重从数据中发现问题、寻找规律,与数据统计的区别在于数据统计的结果可以只是数据或者报表,而数据分析必须从数据中得到一个结论,而且这个结论最好是可以实施的。数据分析的方法包括趋势分析、比较分析、细分分析等,这些方法都落到了具体问题的层面。 - 数据挖掘
数据挖掘更多地上升到了预测的层面,关联规则,监督学习,无监督学习这些都是根据现有特征做出一些规律性的预测。同样是针对具体问题的展开,与数据分析不同的是数据挖掘接住了一些复杂的算法,借助计算机强大的计算能力从海量的数据中寻找规律。
这三个概念没有明显的分界线,相互之间存在交叉,用一些数据统计的方法得出的某些数据特征可以直接说明某些问题,因此这时已经完成了数据分析的过程。而在进行数据分析时,我们往往会借助数据挖掘中的一些思路和简单的算法来完成。同样,数据挖掘的某些算法借助数据统计的方法或者以数据统计为基础。