数据仓库-HIVE初识

建立数据仓库的目的是将各业务系统中的数据进行多维度的抽取、汇聚以实现不同的目的,主要用于统计、BI等。

数据仓库是一个从整体着手,然后逐步解决细节问题的体系结构,它是伴随着信息与决策支持系统诞生的,主要特性是:面向主题、数据集成(统一编码和规范)、非易失、随时间变化。

建立过程:建主题--建表--迁移数据--分析

数据仓库存储的数据颗粒度很重要:高科粒度(低细节,统计数据),低颗粒度(每一条记录都要,比较费存储且影响查询性能),双重颗粒度是一般公司的选择。

发布了36 篇原创文章 · 获赞 7 · 访问量 3万+
展开阅读全文

没有更多推荐了,返回首页

©️2019 CSDN 皮肤主题: 大白 设计师: CSDN官方博客

分享到微信朋友圈

×

扫一扫,手机浏览