一、关系代数
合并数据集合的理论基础是关系代数,它是由E.F.Codd于1970年提出的。
在关系代数的形式化语言中,用表、或者数据集合表示关系或者实体,用行表示元组,用列表示属性。
关系代数包含以下8个关系运算符
1. 选取:返回满足指定条件的行。
2. 投影:从数据集合中返回指定的列。
3. 笛卡尔积:是关系的乘法,它将分别来自两个数据集合中的行以所有可能的方式进行组合。
4. 并:关系的加法和减法,它可以在行的方向上合并两个表中的数据,就像把一个表垒在另一个表之上一样。
5. 交:返回两个数据集合所共有的行。
6. 差:返回只属于一个数据集合的行。
7. 连接:在水平方向上合并两个表,其方法是:将两个表中在共同数据项上相互匹配的那些行合并起来。
8. 除:返回两个数据集之间的精确匹配。
此外,作为一种实现现代关系代数运算的方法,SQL还提供了:
子查询:类似于连接,但更灵活;在外部查询中,方式可以使用表达式、列表或者数据集合的地方都可以使用子查询的结果。
二、连接类型
在关系代数中,连接运算是由一个笛卡尔积运算和一个选取运算构成的。首先用笛卡尔积完成对两个数据集合的乘运算,然后对生成的结果集合进行选取运算,确保只把分别来自两个数据集合并且具有重叠部分的行合并在一起。连接的全部意义在于在水平方向上合并两个数据集合(通常是表),并产生一个新的结果集合,其方法是将一个数据源中的行与另一个数据源中和它匹配的行组合成一个新元组。
SQL提供了多种类型的连接方式,它们之间的区别在于:从相互交叠的不同数据集合中选择用于连接的行时所采用的方法不同。
连接方式 | 结果 |
内连接 | 只连接匹配的行 |
左外连接 | 包含左边表的全部行(不管右边的表中是否存在与它们匹配的行),以及右边表中全部匹配的行 |
右外连接 | 包含右边表的全部行(不管左边的表中是否存在与它们匹配的行),以及左边表中全部匹配的行 |
全外连接 | 包含左、右两个表的全部行,不管另外一边的表中是否存在与它们匹配的行 |
交叉连接 | 生成笛卡尔积-它不使用任何匹配或者选取条件,而是直接将一个数据源中的每个行与另一个数据源的每个行都一一匹配 |
如果FROM子句指定了多于一个表引用,则查询会连接来自多个表的行。连接条件指定各列之间(每个表至少一列)进行连接的关系。因为正在比较连接条件中的列,所以它们必须具有一致的数据类型。
SELECT语句的FROM子句可以指定以下几种类型的连接
FROM子句关键字 | 相应的结果集 |
INNER JOIN | 仅对满足连接条件的CROSS中的列 |
LEFT OUTER JOIN | 一个表满足条件的行,和另一个表的所有行 |
RIGHT OUTER JOIN | 与LEFT相同,但两个表的角色互换 |
FULL OUTER JOIN | LEFT OUTER 和 RIGHT OUTER中所有行的超集 |
CROSS JOIN | 笛卡尔乘积(所有可能的行对) |