数据分析技术—关系数据库理论

现在开始学习数据分析的一系列理论与技术

慢慢一些技术会发表到博客

形式化关系查询语言

关系代数是一种过程化的查询语言,它包含一个运算的集合,这些运算以一个或两个关系为输入,产生一个新的关系作为结果。关系代数基本运算有:选择,投影,并,集合差,笛卡尔积和更名。还有一些其他运算比如,集合交,自然连接和赋值。可以运用基本运算来定义这些运算。

基本运算:

选择,投影和更名称为一元运算,因为他们对一个关系进行运算,另外三个运算对两个关系进行运算,因而称为二元运算

选择运算(Select):选出满足给定谓词的元组sigma(δ)来表示选择,而将谓词写作δ的下标。例如

δdept_name=’Physics’(instructor)

表示的是:选择关系instructor中属于'物理'系的那些元组

通常我们允许在选择谓词中进行比较,使用的是=,!=,>,<等另外我们可以用连词and(Λ),or(ν),nor()将多个谓词合并为一个较大的谓词

投影运算(Projection):投影运算是一元运算,他返回作为参数的关系,但把某些属性排除在外,由于关系是一个集合,所以所有重复的行均被去除。用pi(П)表示

例如:ПID,name,salary(instructor)列出所有教师的ID,name,salary

关系运算的组合:一般来说,由于关系代数的结果同其输入的类型一样,仍为关系,所以我们可以把多个关系运算组合成一个关系表达是(relational-algebra expression)

例如Пname(δdept_name='Physics'(instructor))

并运算:(Union)

将两个集合并起来,我们需要保证并运算的关系是相容的。因此要是并运算rUs有意义,我们要求一下两个条件同时成立:

1 关系r和s必须是同元的,即他们的属性数目必须相同

2 对所有的i,r的第i个属性的域必须和s的第i个属性的域相同

注意:r和s可以是数据库关系或者作为关系代数表达式结果的临时关系

集合差运算

用-表示的集合差运算(Set-Difference)运算使得我们可以找出一个关系中而不在另一个关系中的那些元组。表达式r-s的结果即包含所有在r中而不在s中的元组关系

要使差运算有意义:要求关系r和s是同元的,且对于所有的i,r的第i个属性的域和s的第i个属性的域都相同

笛卡尔积运算

用X表示笛卡尔乘积(Cartesian-product)运算使得我们可以将任意两个关系的信息组合在一起。例如rXs。

更名运算

我们可以通过小写希腊字母rho(ρ )表示更名(rename)yu运算完成这一任务对给定关系代数表达式E,表达式px(E)返回表达式的结果,并把名字x赋给了它

未完待续!!!



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值