数据仓库(Data Warehouse)建设的流程[web业务交互之外部分]

1.下载安装VMware

2. CentOS创建虚拟机

3.选择NAT模式进行网络配置

4.远程终端工具进行安装,Xshell和Xftp

5.虚拟机环境准备

6.克隆虚拟机

7.在第二台虚拟机安装jdk

8.在第二台虚拟机安装Hadoop

9.使用完全分布式运行模式

10.编写集群分发脚本 xsync

11.SSH 无密登录配置

12.集群配置

13.配置历史服务器

14.配置日志的聚集

15.Zookeeper 集群操作

16.Hadoop 集群离线安装 mysql

17.Hadoop 集群安装 hive

18.Sqoop 安装与配置

19.mysql的数据导入hive当中并创建 ODS

20.DWD数据采集模块

21.数仓搭建-DWS

22.指标选取

23.创建ADS层并创建临时表,方便后续导入到mysql当中

24.mysql建表并导入数据

26.离线可视化

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
数据仓库又称为数据集市,是一个用于存储和管理企业各种数据的中心化系统。它通过将来自不同来源的数据进行整合和转化,为企业提供决策支持和业务分析的数据基础。 数据仓库的主要目的是提供一种经过整理和预处理的数据源,供企业管理层和决策者进行分析和决策使用。它不只是一个数据库,而是一个面向主题的跨系统的集成数据源,在数据集成和数据转换的基础上,提供简单、一致和易理解的数据视图。数据仓库包括了基本数据集以及与决策过程相关的元数据,以支持数据挖掘、OLAP分析和预测等业务需求。 数据仓库的优势主要体现在以下几个方面: 1. 数据一致性:数据仓库将来自不同系统的数据进行整合和统一,保证了数据在各个应用系统之间的一致性和准确性。 2. 决策支持:数据仓库为企业管理层提供了全面、准确的数据信息,帮助他们进行决策和制定战略。 3. 数据分析:通过数据仓库,企业可以进行复杂的数据分析,挖掘隐藏在海量数据背后的有价值信息,从而发现业务机会、预测市场趋势等。 4. 灵活性和可扩展性:数据仓库的设计可以根据企业需求进行灵活的配置和扩展,以适应业务的变化和发展。 总之,数据仓库作为企业信息化建设的核心组成部分,帮助企业整合、管理和分析多源、多种类的数据,为企业的决策和业务提供了有力支持,成为现代企业管理的重要工具。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

我是祈哦

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值