数据库关系代数的聚集函数

最新推荐文章于 2025-03-25 11:49:59 发布

Gosick_Geass_Gate

最新推荐文章于 2025-03-25 11:49:59 发布

阅读量1.4w

点赞数 25

本文链接：https://blog.csdn.net/Gosick_Geass_Gate/article/details/85794100

版权

$聚集运算（aggregation\;operation）\mathcal{G}通常的形式如下：$

$_{G_1, G_2, ..., G_n}\mathcal{G}_{F_1(A_1), F_2(A_2), ..., F_m(A_m)}(E)$

$其中E是任意关系代数表达式（或者说是一个关系），G_1, G_2, ..., G_n是用于分组的一系列属性；\\每个F_i是一个聚集函数，每个A_i是一个属性名。运算含义如下，表达式E的结果中元组以如下\\方式被分成若干组$

（1）同一组中所有元组在 $G_1, G_2, ..., G_n$ 上的值相同；

（2）不同组中元组在 $G_1, G_2, ..., G_n$ 上的值不同。

$写成 S Q L 查询语句的形式：$

select $G_1, G_2, ..., G_n, F_1(A_1), F_2(A_2), ..., F_m(A_m)$

from $E$

group by $G_1, G_2, ..., G_n$

$所以最后得到的关系模式为(G_1, G_2, ..., G_n, F_1(A_1), F_2(A_2), ..., F_m(A_m))。\\ 通常采用更名运算为这个模式更改新的关系名以及属性名，然后再使用自然连接或\theta连接\\进行筛选得到目标元组。\\ 考虑以下关系数据库，分别给出下列查询的关系代数表达式：$
下划线表示主码
$（1）找出员工最多的公司。\\ 先分组聚集得到每个公司的员工数目（模式：公司名称，员工数目）：\\ t_1\leftarrow \rho_{r_1(company\_name, employee\_count)}(_{compnay\_name}\mathcal{G}_{count(personal\_name)}(works))\\ 再聚集得到员工数目最多的公司（模式：员工数目，而且该模式只有一个元组）：\\ t_2\leftarrow \rho_{r_2(employee\_count)}(\mathcal{G}_{max(employeel\_count)}(t_2))\\ 最后做自然连接过滤筛选出员工最多的公司名称：\\ \Pi_{compay\_name}(t_1\bowtie t_2)$

$（2）找出工资最少的员工所在公司。\\ 先聚集得到工资最少的员工（模式：工资，而且该模式只有一个元组）：\\ t_1\leftarrow \rho_{r_1(salary)}(\mathcal{G}_{min(salary)}(works))\\ 再做自然连接过滤筛选得到工资最少的员工所在的公司名称：\\ \Pi_{company\_name}(t_1\bowtie works)$

$（3）找出人均工资First\; Bank\; Corporation人均工资高的公司。\\ 先聚集得到First\; Bank\; Corporation的人均工资（模式：工资，而且该模式只有一个元组）\\ t_1\leftarrow \rho_{r_1(salary)}(\mathcal{G}_{avg(salary)}(\sigma_{company\_name="First\; Bank\; Corporation"}(works)))\\ 再做\theta连接过滤筛选得到工资最少的员工所在的公司名称：\\ \Pi_{company\_name}(works\bowtie_{works.salary>t_1.salary}t_1)$