很多时候我都是存储大量数据的首选,你要做的,就是选择一个我的家族成员而已,比如:Oracle, MySQL, Db2,SQL Server这些家伙。
对了,还有一个小巧玲珑的SQLite,做手机端开发的离不开它。
一、有着坚实的数学基础
域,关系,笛卡尔积
关系代数:选择,投影,连接
啥叫关系?所谓关系,在数学上的定义就是笛卡尔积的一个子集。
例如有两个集合:
s1 ={a,b}
s2 = {1,2}
那s1和s2的笛卡尔积就是 :
S = s1 × s2 = {(a,1),(a,2),(b,1),(b,2)}
那么S 的任意一个子集都是关系:
{(a,1),(a,2)} 是一个“关系”
{(a,2), (b,1),(b,2)} 是另外一个“关系”
{(b,2)} 也是关系
我还有个很漂亮的性质:
关系(表)经过运算以后,如select,join,where,交、并、差,结果还是一个关系(表)!
二、很直观
如果你想给一个非计算机专业的人讲解数据库,可以和Excel类比下, 看看他能不能听懂: 瞧, 这不就是个表格吗,有行有列的。
三、使用简单
这里不得不说说SQL这个优秀的抽象层,它完全屏蔽了底层的实现细节,你完全不用考虑底层的文件是怎么存放的,只要发出SQL : SELECT … FROM … WHERE … 就好。
四、对数据完整性的支持很好
我的每个字段都有确定的类型,还可以检查数据的长度,取值范围。
我的主键和外键,共同保证了数据的精确性和一致性, 防止数据的缺失。
五、支持事务
这可能是我能成功的一大关键了, ACID对于核心系统的数据(如银行账号)无比重要,不难想象一个转账操作没有完成会带来什么样的影响。
六、范式
想要使用我们关系型数据库,必须得遵守一定的规则,这些规则就是“范式”。
- 第一范式是基本要求,即每个列都是不分割的数据项。
- 第二范式要求实体属性要完全依赖主键,不能依赖部分主键。
- 第三范式就是一个表中不能包含其它表中已包含的非主关键字信息。不严谨地说就是这个表只包含其他表的ID。
一般来说,你们都会遵循第一和第二范式, 但是为了性能,为了避免过多的join, 有时候会违反第三范式,冗余一些字段的信息。
参考文章:
- 《码农翻身》