数据仓库
fengyuruhui123
我比较认同电影《教父》里的人生观: 第一步要努力实现自我价值,第二步要全力照顾好家人,第三步要尽可能帮助善良的人,第四步为族群发声,第五步为国家争荣誉。 事实上作为男人,前两步成功,人生已算得上圆满,做到第三步堪称伟大,而随意颠倒次序的那些人,一般不值得信任。
展开
-
Oracle 索引详解
一.索引介绍1.1 列表内容索引的创建语法:CREATE UNIUQE | BITMAP INDEX <schema>.<index_name> ON <schema>.<table_name> (<column_name> | <expression> ASC | DESC, <column_name> | <expression> ASC |翻译 2017-03-17 11:30:33 · 634 阅读 · 0 评论 -
ODS系统基于存储过程实现数据清洗实例
场景:由于公司目前没有特定的产品去实现关于数据清洗,目前只能通过对应的存储过程方式来做处理。整个ETL实现流程图如下:业务提供清洗规则:具体实现方案:按照业务规则,需要对数据缺失值做清洗,对数据范围值域做清洗,非数值清洗,非日期值做清洗,包括空格清洗做相应处理。对需要做数据清洗的表字段和特定业务校验规则,做分类标记。a)生成配置表。表结构如下: b)创建表 DATA_DEF_LONG_F 用来原创 2016-11-30 22:14:03 · 2865 阅读 · 0 评论 -
数据仓库技术中的MPP
数据仓库世界里面的massively parallel processing 大概定义: MPP 是将任务并行的分散到多个服务器和节点上,在每个节点上计算完成后,将各自部分的结果汇总在一起得到最终的结果。 首先MPP 必须消除手工切分数据的工作量。 这是MySQL 在互联网应用中的主要局限性。 另外MPP 的切分必须在任何时候都是平均的 , 不然某些节点处理的时间就明显多于原创 2016-11-22 14:26:46 · 12283 阅读 · 0 评论