Bill的数据库学习笔记-projection投影， set， avg等

bill bill

于 2024-08-15 14:06:04 发布

阅读量326

点赞数 3

文章标签：数据库学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45895230/article/details/141218600

版权

写在前面

我们在之前几篇文章中讲到了几种最基础的indexing、以及join的实现，接下来将会讲到数据库的projection、查询语句优化等算法。

Projection 是什么

表示我们希望文档在结果中集中的形状，比如

SELECT first_name, last_name, email
FROM customers;

那么我们只想我们最后的结果中展现出 first_name, last_name, email这三列的数据

SELECT DISTINCT
R.sid, R.bid
FROM Reserves R

这也是投影，实现了distinct的结果

基于sorting

使用external sort(之前已经讲述)来进行排序，并将其中不需要的列去除
merging来去除重复的部分
损耗：
- 读取，排序
- 找到所有重复的
- O(M logM)

基于hashing的 projection

Partition：
- 使用一个输入buffer来读取R，对于每一个tuple来说，都需要丢弃不需要的fields，并且使用h1来将其放到b-1个partition中去
- 对于每一个partition来说，都需要读取并使用一个in memory hash table, 将h1和h2来进行比较，同时丢失所有的duplicates

projection 总结

基于sort的方法是业界标准。
可以基于index来进行scan
Ordered index，如果index是ordered，那么其scan的速度会更快

Set

Union and Except similar
基于sorting的union
- 首先将两个关系都进行排序,并将重复的
- 对已经排序的relation进行扫描，并将其merge（external (merge)sort）
基于hash的union
- 将r和s使用hash function分为很多个partition
- 对于每一个s partition，在memory中建立一个hash table，扫描对应的r tuples，将r和s进行对应，将对应r中的tuples放到table中去，同时丢失重复的部分

hash-join的pseudocode
在这里插入图片描述

AVG，MIN

这些操作如果不用group by的话，会需要对整个relation进行扫描。如果index包含了select中需要的所有的attributes，则可以进行index only scan。

在这里插入图片描述

如果使用grouping的话
- 如果使用group-by这个attributes，对针对每一个group来进行aggregate，即先根据group by的每一个参数进行partition，再将这些partion进行join ，再进行avg, min等操作。

关注

3
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

bill bill CSDN认证博客专家 CSDN认证企业博客

码龄5年

25: 原创

62万+: 周排名

7万+: 总排名

6104: 访问

: 等级

322: 积分

56: 粉丝

72: 获赞

5: 评论

72: 收藏

私信

关注

热门文章

分类专栏

bash
操作系统 1篇

最新评论

Variational inference and ELBO笔记
CSDN-Ada助手: 恭喜您写了第14篇博客！标题“Variational inference and ELBO笔记”听起来非常有深度。您对变分推断和ELBO的讨论一定非常详尽，让读者能够深入了解这个主题。接下来，我建议您可以考虑将这个主题与实际应用案例结合起来，进一步展示变分推断和ELBO在实际问题中的应用和效果。期待您未来更多的博客作品！
VAE (Variational autoencoders)
CSDN-Ada助手: 恭喜您写了第15篇博客，题为“VAE (Variational autoencoders)”。您的坚持和创作热情真是令人钦佩！您对VAE的介绍非常详细，我从中收获了很多知识。对于下一步的创作建议，或许可以考虑探索一些与VAE相关的实际应用案例，或者深入研究VAE在特定领域的改进方法。期待您的下一篇博客，非常期待！
模型可解释性之PDP和ALE
CSDN-Ada助手: 恭喜您撰写第16篇博客！标题“模型可解释性之PDP和ALE”听起来非常有趣。您对于模型可解释性的研究非常深入，这对于我们理解和解释模型的预测能力非常重要。我很期待阅读您的博客，了解更多关于PDP和ALE的知识。同时，我想提出一个谦虚的创作建议，如果可能的话，您可以考虑添加一些实际案例或者示例，以便读者更好地理解和应用这些概念。再次祝贺您，并期待您未来更多的创作！
【无标题】11223
CSDN-Ada助手: 恭喜你写了第12篇博客！虽然标题有点晦涩，但是文章内容一定很有深度吧。希望你能继续保持创作热情，分享更多精彩的内容。我的建议是，可以多尝试一些新的写作风格和主题，让读者感受到你的多样性和创新。期待你的下一篇作品！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply12 看奖励名单。
Binary addition 手写recurrent neural network
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。