数据仓库
文章平均质量分 90
fx_bull
这个作者很懒,什么都没留下…
展开
-
数据仓库基础
数据仓库是一个面向主题的、集成的、稳定的、反映时间变化的,用于支持管理决策的数据集合, 需要具备可读性,保证数据一致。数据仓库有两位大师 William H.Inmon 和 Ralph Kimball。 Inmon 是正统的学术派,比较强调自上而下的建模,强调从源系统的业务与数据出发,在企业全局高度进行业务对象抽象,建立企业级数据仓库系统。 Kimball 是强调从数据仓库应用角度出发,自...原创 2016-04-18 15:36:44 · 214 阅读 · 0 评论 -
hive分析函数
遇到以下问题如何解决? 查询客户各个日期的历史累积购买金额 查询每个客户第一次(首购)或前N次购买记录 查询每个客户最后一次购买记录 某活动推广后,每天的累积数据 查询客户每天的历史累积购买金额 历史累积 hive 语法: SELECT userid user_id, pay_datekey pay_datekey, pay_amount pay_amou...原创 2016-04-19 11:12:04 · 168 阅读 · 0 评论 -
数据开发方法论
由于公司数据平台对ETL开发工具做了比较好的封装,较大程度上面提升了开发效率,数据开发同学的主要工作集中在写SQL,疲于应付各种各样庞大的业务需求。不少同学认为做数据开发没技术含量,技术上面没提升,久而久之产生厌烦感。 个人认为造成这种想法的主要原因是: 通过ETL方式解决一个点的需求,没有站在一个全局的角度来思考问题,建设数据,没有任何沉淀和反思。 对数据开发没有一个清晰...原创 2016-04-28 18:13:55 · 259 阅读 · 0 评论 -
test12
aaaaaaaaaa原创 2016-05-09 15:59:58 · 114 阅读 · 0 评论 -
数据仓库建设碎念
数据仓库呈现给数据应用人员的是一张张数据表,而仓库建设人员要解决的关键问题是:如何对客观世界的复杂业务逻辑进行建模,高效组织数据,将模型转化成数据表,最大化的发挥数据价值,应对业务变更以及进行上层业务支撑。如果数据组织不好,将会产生大批垃圾数据, 如果数据不被使用,建设数据仓库也就毫无用处。 数据开发 数据仓库严格来说是一种体系结构,在工作过程中,有的同学认为数据开发相对系...原创 2016-04-07 12:03:39 · 139 阅读 · 0 评论