一文彻底搞懂数据库的三范式

前言


每天开各种会议,这不刚刚结束的组织生活会的批评环节,我又收到了一条批评,说我技术分享不多,不够,没有有效起到传帮带的作用。好吧,以后就把这些日常的传帮带都总结起来,发到这里,作为一个记录,也以备组内小兄弟们后续翻阅查看。

这几天在整理数据库表的时候,看到之前的支撑方建的那些表,简直不忍直视,完全没有逻辑可言,反正就是一堆东西都放到一个表里,不知道大学数据库理论是怎么学习的。今天在和组内小兄弟们沟通时,就说起这个东西,正好涉及到数据库的三范式,就顺带总结下来。

数据库三范式


这个东西是一种关系型数据库设计理论理论原则,也不是说必须去遵守,只是说我们在进行数据库建模时,按着这个理论来执行,会更科学一点,会更合理一点,后续扩展性会更强一点;并且能在很大程度上消除数据冗余和数据依赖性,提高数据库的性能和数据一致性。

所以,这套理论有这种那种的优点,我们在进行关系型数据库建模时,也基本都是按照这个理论来执行的,至少按照这个来,做出来的东西不会太差。

三范式的定义:

  • 第一范式(1NF):确保数据库中的每个列都是原子性的,即每个列都不可再分。

  • 第二范式(2NF):在满足第一范式的基础上,确保数据库中的每个非主键列完全依赖于主键。

  • 第三范式(3NF):在满足第二范式的基础上,确保数据库中的每个非主键列都不传递依赖于主键。

以上是三范式的定义,可能不是很好理解,下面通过具体的数据库建模实例来进行说明。

第一范式(1NF)


第一范式(1NF)要求的是列的原子性。这样讲可能不太好理解,现在有下面这样的一个地址表:

a1f77f2e3b512a506046590ce2f13dd8.png

结合第一范式(1NF)的定义,很显然,地址详情这列包含的信息量很大,显然是可以拆分的。按照第一范式(1NF),我们进行以下拆分:

05651fd7d7bcb5dc58ea29527a734301.png

这样拆分完,每个列都无法进行再次拆分了,同时使得数据库结构更加清晰和易于维护,也有利于后期的运营分析。

第二范式(2NF)


第二范式(2NF)要求每个非主键列只依赖于主键而不依赖于其他非主键列,具体的应用场景是联合主键(多个字段共同充当表的主键),这里通过以下例子来进行说明(订单编号和产品编码组成联合主键):

9b17b49fc2c5e9889ad8e6ea2e906116.png

直接看感觉没有什么毛病,但是我们来对上表的字段进行分析:

  • 购买价格:购买价格完全依赖订单编号+产品编号,订单编号+产品编号同时确定才能确定购买价格(同一产品在不同的订单会有不同的价格);

  • 购买数量:购买数量完全依赖订单编号+产品编号;订单编号+产品编号同时确定才能确定购买数量;

  • 订单总金额:订单总金额只依赖于订单编号,和实际的产品没有关系,我们通过订单编号就可以明确订单总金额;所以该字段违背了第二范式(2NF);

  • 购买时间:购买时间只依赖于订单编号,一个订单的所有商品肯定是同一时间购买的,该字段很明显和产品编号是无任何依赖关系的;所以该字段也违背了第二范式(2NF)。

现在我们进行优化,进行表拆分,拆分后得到两个表:

655c51e9b10b73c8e2e065d748b93d7a.png

8f5cd5860a5b0dd0a6d4101489554259.png

这样拆分完后,就符合了第二范式(2NF),同时数据结构更加清晰,也减少了数据冗余。

第三范式(3NF)


第三范式(3NF)说直白点就是表中的非主键字段和主键字段直接相关,不允许间接相关。下面通过一个表来进行说明(主键:部门ID)。

046f4c73db410ce796b9014da9e021e7.png

很明显,部门名称和负责人和部门ID是直接关联了,而负责人性别和负责人年龄和部门ID并没有直接关系,而是和负责人直接关联的,所以就存在这种传递依赖关系了。

部门ID->负责人->负责人性别

部门ID->负责人->负责人年龄

这就违反了第三范式(3NF),这个时候就需要把上表拆分成两张表,以外键形式关联。如下所示:

9a2085300e20e39d8465b5ad3235665e.png

74e2c1d03dfa8c60d6f2c45bcb0d9e88.png

这样拆分后,结构立马清晰了,每个表存储的数据也都是单一的。

总结


在日常开发中,我们少不了进行功能模块的数据库建模,而数据库三范式是设计数据库表结构的规则约束,通过遵循三范式,可以减少数据冗余、提高数据的一致性和准确性,并且简化数据库的设计和维护。

但是通过上面的分析,我们遵循了三范式,就会多了好几张表,导致在一些业务复杂的场景,就会出现多表关联查询效率低的问题。所以,有的时候进行系统性能优化时,也会打破三范式规则,进行局部变通,做到根据具体业务场景活学活用。

但凡事都有一个但是,但是在实际开发中允许局部变通。

  • 6
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python面向对象编程(Object-Oriented Programming,简称OOP)是一种编程范式,它将数据和操作封装在对象中,通过对象之间的交互实现程序的设计和开发。下面是一些关键概念,帮助你更好地理解Python面向对象编程。 1. 类(Class):类是对象的蓝图或模板,描述了对象的属性和行为。它定义了对象的特征和方法。例如,我们可以定义一个名为"Car"的类来表示汽车,其中包含属性(如颜色、型号)和方法(如加速、刹车)。 2. 对象(Object):对象是类的实例,是具体的实体。通过实例化类,我们可以创建一个对象。例如,我们可以创建一个名为"my_car"的对象,它是基于"Car"类的实例。 3. 属性(Attribute):属性是对象的特征,用于描述对象的状态。每个对象都可以具有一组属性。例如,"Car"类的属性可以包括颜色、型号等。 4. 方法(Method):方法是对象的行为,用于定义对象的操作。每个对象都可以具有一组方法。例如,"Car"类的方法可以包括加速、刹车等。 5. 继承(Inheritance):继承是一种机制,允许我们创建一个新类(称为子类),从现有类(称为父类)继承属性和方法。子类可以扩展或修改父类的功能。继承可以实现代码重用和层次化设计。 6. 多态(Polymorphism):多态是一种特性,允许不同类的对象对同一方法做出不同的响应。多态提高了代码的灵活性和可扩展性。 7. 封装(Encapsulation):封装是一种将数据和操作封装在对象中的机制,隐藏了对象的内部实现细节,只暴露必要的接口给外部使用。这样可以保护数据的安全性,提供了更好的模块化和代码复用性。 通过理解这些概念,你可以更好地掌握Python面向对象编程。在实践中,你可以使用类来创建对象,操作对象的属性和调用对象的方法,通过继承和多态实现代码的灵活性和可扩展性,通过封装保护数据的安全性和提高代码的可维护性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值