大数据
data_fan
推荐/用户画像,关注自我成长
展开
-
数据仓库介绍
什么是数仓 数据仓库简称DW,就是一个用以更好地支持企业或组织的决策分析处理的、面向主题的、集成的、不可更新的、随时间不断变化的数据集合。 为什么要有数仓 主要因为面向应用型的应用的数据库设计一般是操作型的,而数据分析或者数据挖掘都是面向分析型的应用。这两种应用各有特点和适用的场景,对数据的处理应当分离。 业务数据库 数据仓库 遵循3NF范式,表与表之前关联复杂 星型模型,事实表,...原创 2019-06-17 17:23:06 · 395 阅读 · 0 评论 -
常用工具网站
-大数据导航: http://hao.199it.com/转载 2019-06-21 16:58:41 · 156 阅读 · 0 评论 -
数据仓库学习资料
资源 Hive官方文档:https://cwiki.apache.org/confluence/display/Hive/Home#Home-UserDocumentation 《Hive编程指南》 《数据仓库工具箱 维度建模权威指南》 《大数据之路:阿里巴巴大数据实践》 下载链接 链接:https://pan.baidu.com/s/1PmqZhpxphSlgTXJGR0b-4g 提取码:s...原创 2019-06-17 17:45:31 · 437 阅读 · 0 评论 -
深入理解Hive
背景 做数据分析和数据仓库的童鞋平常工作中用到的最多的语言就是Hive SQL。那么我们在熟悉编写Hive SQL之后,是不是可以再深入地去了解多一些它的底层实现呢。这篇文章总结了一下我对理解Hive sql的一些知识点总结。 ...原创 2019-06-18 18:11:34 · 333 阅读 · 0 评论