集合运算
集合的角度
](http://datawhale.club/uploads/default/original/1X/05b62bc4e0974ecdf01957f3e84ae613746cbb3e.png)
上面两个是集合算运算的韦恩图,我们把数据库的表当做集合,那么表的运算就是维恩图表示的运算了。
表的加法-UNION
求并集
UNION
和OR
运算是一样的
扩充-bag模型和set模型
bag模型就是数据库的表示可以有重复的—和python的list很像
set模型就是数据库的表不能重复—和python的set很像
差集-EXCEPT
MYSQL数据库没有差集,NOT
谓词表示
对称差
MYSQL数据库没有对称差,NOT IN
实现
连结
JOIN
这个在pandas里面是有的,其中逻辑就是,我使用各种表格筛选语句,在大数据量的情况下,对于多个数据的查询和运算使得程序过于耗时。所以我们可以将几个表格连接成一个表格,然后运算的时候就是对一个表格做运算,效率提升。
内连接INNER JOIN
FORM <TAB 1> INNER JOIN <TAB 2> ON <CONDITION(S)>
这里的ON
是连接条件的地方,后面跟着条件
**值得注意的是:**如何不用ON
,表也是可以合并的,但是合并的表就是一个笛卡尔积运算的表(就是一个集合的运算方式)
内连接还有一个就是,在两个表中,我根据ON
后面的条件连接,但是表的数据无法意义对应的话,无法对应的数据会被删除。
自连接 SELF JOIN
这是一个tricks,怎么说呢,自连接就是在同一个表,我使用不同的方法来做连接。
其目的还是运算方便。
自然连接 NATURAL JOIN
(空)
外连接 OUTER JOIN
内连接的数据中有讲到。如何数据在两个表中无法一一对应,无法对应的部分会被删除。
**分为:**左连接,右连接以及全连接