Blink中的维表join及优化

本文介绍了Blink中的维表JOIN优化方法,包括LRU和ALL缓存策略,如何提高缓存命中率,以及Partitioned All Cache解决超大维表JOIN问题。此外,还讨论了Async维表JOIN优化,通过异步访问提升性能。最佳实践建议根据维表大小和数据分布选择合适的优化策略。
摘要由CSDN通过智能技术生成

我觉得本篇博客算是性能优化的一个补充,性能优化篇:
Blink性能优化配置及原理


双流john

• 支持等值连接和不等值连接
• 支持 INNER JOIN, LEFT JOIN, RIGHT JOIN, FULL JOIN, ANTI JOIN, SEMI JOIN
• 不等值连接因为缺少等值条件,所以数据会聚集到一个并发上计算,性能会不高

  SELECT o.rowtime, o.productId, o.orderId, o.units,
  p.name, p.unitPrice
  FR
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Blink SQL 支持在维表(dimension table)和事实表(fact table)之间进行 join 操作,以便在查询使用维表的属性。维表通常包含静态数据,例如产品信息、客户信息等,而事实表则包含动态数据,例如销售记录、订单记录等。 维表 join 的语法如下: ```sql SELECT fact_table.*, dim_table.* FROM fact_table JOIN dim_table ON fact_table.dimension_column = dim_table.dimension_column ``` 其,`fact_table` 是事实表,`dim_table` 是维表,`dimension_column` 是两个表共同的维度列。在 join 操作,通过将维度列作为 join 条件,将事实表的每一行与维表匹配的行进行组合。这样,查询结果将包含事实表和维表的所有列。 举个例子,假设有一个事实表 `sales_fact` 包含销售记录,和一个维表 `product_dim` 包含产品信息。如果我们想要查询某个时间范围内的销售记录,并且需要显示每个产品的名称和价格等信息,可以使用如下的 SQL 语句: ```sql SELECT sales_fact.*, product_dim.product_name, product_dim.price FROM sales_fact JOIN product_dim ON sales_fact.product_id = product_dim.product_id WHERE sales_fact.order_date BETWEEN '2022-01-01' AND '2022-01-31' ``` 在这个查询,我们通过 `JOIN` 操作将事实表 `sales_fact` 和维表 `product_dim` 进行了组合,并通过 `ON` 子句指定了维度列 `product_id` 作为 join 条件。最终的查询结果将包含销售记录和产品信息的所有列,并限制了销售日期在 2022 年 1 月份的记录。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值