【大数据笔记】SQL Optimizer 解析

本文介绍了大数据体系下的SQL处理流程,重点讲解了SQL查询优化器的工作原理,包括Top-down和Rule-based Optimizer(RBO)以及Cost-based Optimizer(CBO)。RBO基于规则进行优化,而CBO通过估算执行计划的代价来选择最优方案。在大数据场景下,查询优化器对于提升查询性能至关重要。
摘要由CSDN通过智能技术生成

前言

大数据课程相关笔记

一、大数据体系下的SQL 

一、大数据体系
大数据体系自上而下分为七层,分别是:

1. 业务应用
业务应用层次,主要业务应用包括BI报表、数据挖掘、营销分析、精准推荐等,主要工作是管控运维。

2. 数据开发
数据开发层次,主要技术包括Airflow、DAG等,主要工作是集群创建。

3. 权限管控
权限管控层次,主要技术包括Apache Ranger、GDPR等,主要工作是集群创建。

4. 分析引擎(SQL)
分析引擎分为批式分析、实时分析、交互分析等,主要工作是集群管理、服务管理。
(1)批式分析
主要包括Spark、Hive、MR等技术。
(2)实时分析
主要包括Flink技术。
(3)交互分析
主要包括Presto、ClickHouse、Doris等技术。

5. 资源调度
资源调度层次主要包括YARN、K8S等技术,主要工作是用户管理。

6. 存储系统
存储系统层次主要包括HDFS、HBase、NAS、Object Store、数据湖等技术,主要工作是监控报警。

7. 基础设施
基础设施层次主要包括ECS、存储、VPC等技术&#x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值