数仓和数据库的关系
hadoop生态环境
回归到数仓 和数据库
数仓不管是数仓模型还是数仓理论其实是数据分类管理的方法论。对数据划分管理的方法论。
是建立在hadoop之上的,hadoop是数仓的底层技术实现。
数据库
数据存储介质。
数据仓库的一定要建立在基于Hadoop的技术架构上吗?只要是能存储数据的介质都可以。
数仓作用场景
数仓的核心作用 冗余数据 和 降低数据冗余,看似很矛盾实际站在不同角度。
冗余数据(站在中间层的角度)
核心是快速使用:比如小明分析的过程中中间分析的表B、表C小红、小张可以直接取用。
降低数据冗余(站在应用层的角度)
核心是复用性降低储存空间和成本:例如小明、小红、小张原本需要分析三分数据,现在把三分数据变成一份放在中间层又降低了使用空间。
数据仓库能解决哪些问题
回归到企业面临的数据问题,数仓都可以解决其中的一些问题。