数据仓库个人见解
什么是数据仓库?
数据仓库不是数据库,是数据的组织方式,是一种数据存储处理的解决方案。现在流行的大数据,数据湖都是数据仓库的延伸概念。
数据仓库的目的
建立数据仓库的目的有3个
1.看现在
观察现在各种业务的状态
比如现在企业的营收,这个月卖了多少货
2.看未来
通过以往的数据观察未来的业务趋势
比如未来的业务的趋势变化,通过去年就可以知道今年年底的火车票肯定卖的多,要加人手
3.给决策者提供心理支撑
决策者在做决定时,喜欢找依据,通过适当的数据分析,就可以给决策者依据。虽然很多时候决策者的依据不过是心理安慰。
数据仓库的几个重要工作
1.数据存储
数据可以是结构化数据,也可以是图像,视频,音频等非结构化数据。但是存储必须有组织结构。
数据存储不必拘泥于一种技术,数据仓库不是数据库,没限制用哪些技术来组织数据。
结构化数据库存储在关系型数据库中,如mysql,greenplum,teradata,oracle等关系型数据库中。
非结构化数据存储在hadoop,MongoDB等数据库中。
2.数据处理
数据就是数据进行收集,处理的过程。
数据仓库的数据一定是经过了组织结构的调整的,从无序走向有序的过程。
你可以理解为仓库的整理过程,先是什么东西都往仓库仍,然后仓库的管理人员就把这些东西分门别类的放好,这个整理的过程就是数据的处理过程。
3.数据分析