工作总结之因为笛卡尔积问题写SQL搞了半天[害](附笛卡尔积总结)_笛卡尔积sql(2)

img
img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

需要这份系统化资料的朋友,可以戳这里获取

6

虽然上面连接后的表并没有什么实际意义,但这里仅仅作为DEMO使用:-)

关系演算

上面笛卡尔积的概念是关系代数中的概念,而我在前一篇文章中提到还有关系演算的查询方法.上面的关系代数是分布理解的,上面的语句推导过程是这样的:“对表Student和Class进行内连接,匹配所有ClassID和StudentClassID相等行,选择所有的列”

而关系演算法,更多关注的是我想要什么,比如说上面同样查询,用关系演算法思考的方式是“给我找到所有学生的信息,包括他们的班级信息,班级ID,学生ID,学生姓名”

用关系演算法的SQL查询语句如下:

		SELECT *
  FROM [Class] c
       ,
       [Student] s
  where c.ClassID=s.StudentClassID

当然,查询后返回的结果是不会变的:

4

外连接

假设还是上面两个表,学生和班级.我在学生中添加一个名为Eric的学生,但出于某种原因忘了填写它的班级ID:

7 2

当我想执行这样一条查询:给我取得所有学生的姓名和他们所属的班级:

		SELECT s.StudentName,c.ClassName 
        
  FROM [fordemo].[dbo].[Student] s
       inner join 
       [fordemo].[dbo].[Class] c
       on 
       s.StudentClassID=c.ClassID

结果如下图:

8

可以看到,这个查询“丢失”了Eric…

这时就需要用到外连接,外连接可以使连接表的一方,或者双方不必遵守on后面的连接限制条件.这里把上面的查询语句中的inner join改为left outer join:

		SELECT s.StudentName,c.ClassName 
        
  FROM [fordemo].[dbo].[Student] s
       left outer join 
       [fordemo].[dbo].[Class] c
       on 
       s.StudentClassID=c.ClassID

结果如下:

9

Eric又重新出现.

右外连接

右外连接和左外连接的概念是相同的,只是顺序不同,对于上面查询语句,也可以改成:

		SELECT s.StudentName,c.ClassName 
        
  FROM [fordemo].[dbo].[Class] c
       right outer join 
       [fordemo].[dbo].[Student] s
       on 
       s.StudentClassID=c.ClassID

效果和上面使用了左外连接的效果是一样的.

全外连接

全外连接是将左边和右边表每行都至少输出一次,用关键字”full outer join”进行连接,可以看作是左外连接和右外连接的结合.

自连接

谈到自连接,让我们首先从一个表和一个问题开始:

10

上面员工表(Employee),因为经理也是员工的一种,所以将两种人放入一个表中,MangerID字段表示的是当前员工的直系经理的员工id.

现在,我的问题是,如何查找CareySon的经理的姓名?

可以看出,虽然数据存储在单张表中,但除了嵌套查询(这个会在后续文章中讲到),只有自连接可以做到.正确自连接语句如下:

		SELECT m.EmployeeName
  FROM [fordemo].[dbo].[Employee] e
  inner join [fordemo].[dbo].[Employee] m
  on  e.ManagerID=m.id and e.EmployeeName='Careyson'

在详细解释自连接的概念之前,请再看一个更能说明自连接应用之处的例子:

11

这个表是一个出席会议记录的表,每一行表示出席会议的记录(这里,由于表简单,我就不用EmployeeID和MeetingID来表示了,用名称对于理解表更容易些)

好了,现在我的问题是:找出既参加“谈论项目进度”会议,又参加”讨论职业发展”会议的员工

乍一看上去很让人迷惑是吧,也许你看到这一句脑中第一印象会是:

		SELECT  EmployeeName
  FROM [fordemo].[dbo].[MeettingRecord] m
  where MeetingName='¨???????????¨¨' and meetingName='¨???????¨°???¤?é?1'

(我用的代码高亮插件不支持中文,所以上面where子句后面第一个字符串是’谈论项目进度’,第二个是’讨论职业发展’)

恩,恭喜你,答错了…如果这样写将会什么数据也得不到.正确的写法是使用自连接!

自连接的是一种特殊的连接,是对物理上相同但逻辑上不相同的表进行连接的方式。我看到百度百科上说自连接是一种特殊的内连接,但这是错误的,因为两个相同表之间不光可以内连接,还可以外连接,交叉连接…在进行自连接时,必须为其中至少一个表指定别名以对这两个表进行区分!

回到上面的例子,使用自连接,则正确的写法为:

		SELECT  m.EmployeeName
  FROM [fordemo].[dbo].[MeettingRecord] m,
        [fordemo].[dbo].[MeettingRecord] m2
  where m.MeetingName='¨???????????¨¨' and m2.MeetingName='¨???????¨°???¤?é?1'
        and m.EmployeeName=m2.EmployeeName

(关于乱码问题,请参考上面)

多表连接

多个表连接实际上可以看成是对N个表进行n-1次双表连接.这样理解会让问题简单很多!

1 2 12

比如上面三个表,前两个表是我们已经在文章开始认识的,假设现在又添加了一个教师表,对这三个表进行笛卡尔积如下:

		SELECT *
  FROM [fordemo].[dbo].[Class]
       cross join 
       [fordemo].[dbo].[Teacher]
       cross join 
       [fordemo].[dbo].[Student]

结果可以如图表示:

13

总结

文中对SQL中各种连接查询方式都做了简单的介绍,并利用一些Demo实际探讨各种连接的用处,掌握好各种连接的原理是写好SQL查询所必不可少的!


没有join条件导致笛卡尔乘积
学过线性代数的人都知道,笛卡尔乘积通俗的说,就是两个集合中的每一个成员,都与对方集合中的任意一个成员有关联。可以想象,在SQL查询中,如果对两张表join查询而没有join条件时,就会产生笛卡尔乘积。这就是我们的笛卡尔乘积导致的性能问题中最常见的案例:开发人员在写代码时遗漏了join条件。

发生笛卡尔乘积的sql:

view plaincopy to clipboardprint?select sum(project_fj.danjiaproject_fj.mianji) from project_fj,orderform where project_fj.zhuangtai=‘未售’ and project_fj.project_id=30
select sum(project_fj.danjia
project_fj.mianji) from project_fj,orderform where project_fj.zhuangtai=‘未售’ and project_fj.project_id=30

这个语句其实只是sql语句的一部分,问题是另一部分用到了表orderform,所以from中有orderform,但是上面的这部分语句完全没有用到orderform,但是不设置条件就导致了笛卡尔乘积。

解决方法:使用LEFT JOIN

view plaincopy to clipboardprint?select sum(project_fj.danjiaproject_fj.mianji) from project_fj LEFT JOIN orderform ON project_fj.id=orderform.project_id
where project_fj.zhuangtai=‘未售’ and project_fj.project_id=30
select sum(project_fj.danjia
project_fj.mianji) from project_fj LEFT JOIN orderform ON project_fj.id=orderform.project_id
where project_fj.zhuangtai=‘未售’ and project_fj.project_id=30

img
img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

需要这份系统化资料的朋友,可以戳这里获取

-WgKBpaPi-1715784658721)]
[外链图片转存中…(img-9yM3fQUy-1715784658722)]

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

需要这份系统化资料的朋友,可以戳这里获取

  • 29
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值