![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据仓库
iteye_19343
这个作者很懒,什么都没留下…
展开
-
数据仓库建设中的数据建模方法
最近也在构建数据仓库,觉得以下文章不错,转一下! 所谓水无定势,兵无常法。不同的行业,有不同行业的特点,因此,从业务角度看,其相应的数据模型是千差万别的。目前业界较为主流的是数据仓库厂商主要是 IBM 和 NCR,这两家公司的除了能够提供较为强大的数据仓库平台之外,也有各自的针对某个行业的数据模型。 例如,在银行业,IBM 有自己的 BDWM(Banking...原创 2013-07-14 15:57:30 · 92 阅读 · 0 评论 -
[转]Bloom Filter概念和原理
Bloom Filter概念和原理 Bloom Filter是一种空间效率很高的随机数据结构,它利用位数组很简洁地表示一个集合,并能判断一个元素是否属于这个集合。Bloom Filter的这种高效是有一定代价的:在判断一个元素是否属于某个集合时,有可能会把不属于这个集合的元素误认为属于这个集合(false positive)。因此,Bloom Filter不适合那些“零错误”的应用场合。...原创 2013-07-28 12:41:37 · 84 阅读 · 0 评论 -
hive Map-side Aggregation OOM 异常
参考: http://dev.bizo.com/2013/02/map-side-aggregations-in-apache-hive.html 在MapReduce job下面,有个Combiner,工作机制是将Reducer的工作分担一部分给Map阶段来做。 在Hive的执行计划优化中也是如此,默认情况下会开启Map-side Aggregation优化的功能。 sel...原创 2015-07-02 13:40:51 · 167 阅读 · 0 评论