2023-02-04 Apache Calcite 和 SQL 引擎学习资料总结

资料集合

  1. herry liang 优化器技术论文学习知乎专栏
  2. PingCap 学习资料
  3. 清华大学 AIDB 论文
  4. CWI 荷兰数学和计算机科学研究学会数据库Paper
  5. 数据库查询优化器论文列表
  6. 编程小梦康凯森博客
  7. 数据库内核杂谈

SQL 标准

  1. 春眠不觉晓,SQL 知多少?
  2. 数据库必知词汇:SQL标准
  3. SQL标准简介
  4. sql 92 wiki
  5. BNF Grammars for SQL-92, SQL-99 and SQL-2003

SQL 概念学习

  1. 什么是 SQL 谓词,如何使用 SQL 谓词
  2. CNF 合取范式
  3. 分布式SQL执行引擎核心是什么?Fragment、Stage、Subplan等概念有什么区别?
  4. SQL表达式

JDBC Server && Driver

  1. JDBC原理&浅析HIVE-JDBC

SQL 解析 && 元数据验证

  1. SQL 解析
    1. Calcite - 看懂 Parser.jj 中的 SqlSelect
    2. FMPP 介绍
    3. Apache Calcite SQL解析及语法扩展
    4. Calcite SQL 解析、语法扩展、元数据验证原理与实战(上)
  2. SQL 元数据验证
    1. Apache Calcite的类型系统
    2. LinkedIn transport,A framework for writing performant user-defined functions (UDFs) that are portable across a variety of engines including Apache Spark, Apache Hive, and Presto

Apache Calcite 学习

  1. Apache Calcite 一条 SQL 的查询计划生成之旅【上】
  2. Apache Calcite 一条 SQL 的查询计划生成之旅【下】
  3. SQL 查询优化原理与 Volcano Optimizer 介绍
  4. Apache Calcite 处理流程详解(一)
  5. Apache Calcite 优化器详解(二)
  6. Calcite 处理一条SQL - I (SQL to Rel)
  7. Calcite 处理一条SQL - II (Rels Into Planner)
  8. Calcite 启发式 Planner (HepPlanner)
  9. Apache Calcite 知乎学习专栏
  10. Apache Calcite的优化器规则解析
  11. Apache Calcite VolcanoPlanner 详解(三)
  12. Apache Calcite VolcanoPlanner代价计算解析与源码调试方法
  13. Apache Calcite VolcanoPlanner优化过程解析
  14. Calcite 中新增的 Top-down 优化器
  15. Calcite CBO 博客 - RelMetadataProvider 讲解
  16. Apache Calcite Document
  17. Calcite 对 Volcano 优化器优先队列的实现
  18. Apache Calcite Lattices
  19. Calcite RelTrait 概念讲解
  20. calcite 概念和架构
  21. Calcite RelTrait 讲解二
  22. Calcite Volcano Planner
  23. Apache Calcite: A Foundational Framework for Optimized Query Processing Over Heterogeneous Data Sources
  24. Calcite Join 处理 - I (执行器 & 简单 Reorder)

优化器相关技术博客

RBO && CBO && CBQT

  1. 数据库挖矿系列-优化器设计探索穿越之旅
  2. 独家揭秘 | 阿里云分析型数据库AnalyticDB新一代CBO优化器技术
  3. The Volcano Optimizer Generator : Extensibility and Efficient Search
  4. The Cascades Framework for Query Optimization
  5. cascade 优化器 -- 知乎
  6. 级联火山口:数据库查询优化器初探
  7. 什么是谓词下推,看这一篇就够了
  8. 一文终结SQL子查询优化
  9. 数据库内核杂谈(九):开源优化器 ORCA
  10. 《Orca: A Modular Query Optimizer Architecture for Big Data》导读
  11. 用Orca替换MySQL的优化器?
  12. Cost-Based Query Transformation 从论文到工程实现
  13. Cost-based query transformation in Oracle
  14. 《Cost-Based Query Transformation》paper-reading(上)
  15. 《Cost-Based Query Transformation》paper-reading(下)
  16. 更高效的Cascades优化器 - Columbia Query Optimizer
  17. Cascades/Columbia Optimizer
  18. [VLDB 2016] The MemSQL Query Optimizer,HTAP优化器论文阅读
  19. Adaptive Statistics In Oracle 12c

优化器框架业界都有相应的论文,建议看原论文理解

同类引擎学习

  1. StarRocks 源码导读一
  2. StarRocks 优化器代码导读
  3. Tidb Cascades 优化器
  4. PolarDB-X CBO 优化器技术内幕
  5. StarRocks 技术原理资料汇总
  6. PolarDB-X 优化器核心技术 ~ Join Reorder
  7. StarRocks Join Reorder 源码解析
  8. StarRocks 查询优化系列文章
  9. StarRocks 技术内幕 | Join 查询优化
  10. Apache Doris Join 实现与调优实践
  11. 四万字讲解 doris
  12. 通过源码构建 StarRocks
  13. 通过源码构建 Doris
  14. Quick SQL -- 统一异构数据源 SQL 解析和翻译项目
  15. 天穹SuperSQL如何把腾讯 PB 级大数据计算做到秒级?
  16. SuperSQL:跨数据源、跨DC、跨执行引擎的高性能大数据SQL中间件
  17. 「解耦」方能「专注」——腾讯天穹SuperSQL跨引擎计算揭秘
  18. 腾讯天穹SuperSQL联邦融合计算引擎揭秘
  19. PolarDB for MySQL优化器查询变换系列 - join消除

物化视图

  1. 一文详解物化视图改写
  2. 物化视图在 SparkSQL 中的实践
  3. Spark SQL 物化视图原理与实践
  4. Presto 物化视图
  5. Kylin Kube 命中机制
  6. Oracle 物化视图
  7. Calcite UnifyRule物化识别原理
  8. 基于Impala的高性能数仓实践之物化视图服务
  9. SQL Server Partitioned Views
  10. Partitioned views over table partitioning

学习视频

  1. Moody-老师 数据库内核
  2. CMU Database Group - CMU 数据库 youtube,打开有惊喜
  3. 15-721 Advanced Database Systems (Spring 2020)2023 版-15-721
  4. CMU 15-721 | 数据库系统进阶(2020·完整版)
  5. Writing a Streaming SQL & Materialized View Engine - Kenny Gorman
  6. Star Burst 优化器
  7. An Overview of the Starburst Trino Query Optimizer (Karol Sobczak)
  8. Noria: Fast Materialized Views for Fast Websites

相关开源项目

  1. Linkedin coral,这个项目能够将 Presto、Hive、Spark 之间方言互转
  2. substrait,使用 protobuf 来实现引擎中立的查询计划的序列化
  3. 向量化执行引擎框架 Gluten 宣布正式开源
  4. CMU noisepage
  5. Velox,向量化计算算子库
  6. Apache Calcite
  7. Apache Flink
  8. StarRocks
  9. Apache Doris
  10. Dremio

各种开源协议的对比

  1. 五种开源协议的比较(BSD,Apache,GPL,LGPL,MIT)
  2. 三种开源协议的选择:BSD,Apache,MIT

书籍

  1. Internal of Spark SQL
  2. 《数据库查询优化器的艺术:原理解析与 SQL 性能优化》

追踪开源项目 Star 数的网站

  1. 追踪开源项目 Star 数的网站

测试框架和 benchmark

  1. join-order-benchmark
  2. Tpc-ds hive-testbench
  3. 数据集:SSB、TPC-DS、TPC-H
  4. Cost Model 准确性测试:Testing the Accuracy of Query Optimizers
  5. ZetaSQL 语义兼容性测试 - ZetaSQL 本身有 60K+ 测试用例。ZetaSQL 语义兼容性测试的独特之处在于:很大一部分测试用例集中于 SQL 表达式和单个函数,广泛涵盖了不同的边界条件——这是许多其他测试套件不能提供的。
  6. SQL 逻辑正确性测试 - 逻辑正确性SQL 测试的天花板,是 SQLLite 的 SQLLogicTest 框架。它包含超过 7M 个测试查询(即700万!)。Firebolt 编写了一个脚本,将 SQLLogicTests 移植到内部 PeaceKeeper 格式,进行测试。DuckDB 也采用了类似的方法。
  7. 测试工具:YCSB
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

悟世者

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值