normalization(规范化)

规范化理论首先是由E.F.Codd于1971年提出的,目的是要设计“好的”关系数据库模式。规范化是在关系型数据库中减少数据冗余的过程。除了数据以外,在数据库中,名称、对象名称和形式都需要规范化。
在关系数据库中,用范式来衡量数据库规范的层次或深度。区别范式的根据是要区分数据依赖,改变各种范式最终的目的是优化数据库。根据关系模式满足的不同性质和规范化的程度,把关系模式分为第一范式、第二范式、第三范式、BC范式和第四范式等。范式越高、规范化的程度也越高,关系模式则越好。

1NF:第一范式。这是规范化中最基本的级别。它要求:
1. 数据库包含二维的表(即行和列);
2. 无重复的行;
3. 列的数据是同一类型的,每列用唯一的列名;
4. 表的每格必须是单值的,数组和重复的组都不能作为值;


2NF:第二范式。要求:
1. 满足第一范式
2. 一个关系的所有非关键字属性都依赖于整个关键字
根据这一定义,每个以单个属性作为关键字的关系自动进入第二范式。因为关键字是一个属性,所以按缺省约定,每个非关键字属性都依赖于整个关键字,不存在部分依赖关系。
例子:
一个库房存储的库有四个字段(零件号码,仓库号码,零件数量,仓库地址),这个库符合1NF,其中“零件号码”和“仓库号码”构成主关键字。但是因为“仓库地址”只完全依赖与“仓库号码”,即只依赖于主关键字的一部分,所以它不符合2NF,这样首先存在数据冗余,因为仓库数量可能不多。其次,更改仓库地址时,如果漏改了某一记录,就会出现数据不一致性。再次,如果某个仓库的零件出完了,那么这个仓库地址就丢失了,即这种关系不允许存在某个仓库中不放零件的情况。我们可以用投影分解的方法消除部分依赖的情况,而使关系达到2NF的标准。方法是从关系中分解出新的二维表,是每个二维表中所有的非关键字都完全依赖于各自的主关键字。我们可以如下分解:分解成两个表(零件号码,仓库号码,零件数量)和(仓库号码,仓库地址)。这样就完全符合2NF了。


3NF:第三范式
1. 满足2NF
2. 所有的非主关键字都是相互独立的,任何一个数据列的值都不能从其他的列就算得到
例子:
从2NF中消除传递依赖,就是3NF。比如有一个表(姓名,工资等级,工资额),其中姓名是关键字,此关系符合2NF,但是因为工资等级决定工资额,这就叫传递依赖,它不符合3NF,我们同样可以使用投影分解的办法分解成两个表:(姓名,工资等级),(工资等级,工资额)。

BCNF:Boyce-Codd范式
通常认为BCNF是修正的第三范式,它比3NF又进一步,就是如果在第三范式中,若每一个决定因素都包含码,则该关系就是BCNF。


现在,几乎所有的数据库都是基于“第三范式 (3NF)”创建的。这意味着通常都有相当多的表,每个表中的信息列都相对较少。


规范化的利弊:规范化的优点是明显的。他避免了大量的数据冗余,节省了空间,保持了数据的一致性,如果完全达到3NF,你不会在超过一个地方更改同一个值。如果你的记录经常的改变,这个优点回超过所有可能的缺点。它最大的不利是,你把信息放置在不同的表中,增加了操作的难度,同时把多个表连接在一起的花费也是巨大的。即使你花费你所有的午休时间,作出一个完全规范化的数据库(你的大学教授可以证明),它仍然不是完美的。规范化设计所带来的性能问题可能你无法承受。如果出现这种情况,你就要准备进行非规范化了。非规范化就是你为了获得性能上的利益所进行的违反规范化规则的操作,并没有什么魔法在里面。它是一个性能利益分析,尝试和再尝试和不断的再评估过程。它也有很多方法,不过大部分都与实际应用有关系,包括复制属性,复制外来关键字,表合并,表重新组合等等,你可以根据实际的应用选择最有效的方法。

 

转载地址:http://blog.chinaunix.net/u/11077/showart_151893.html

note:只为学习用,转载请注上面转载地址和原作者名

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 数据规范化Normalization)是一种数据预处理技术,它用于将数据转换为一定范围内的标准值,以便更好地处理和比较数据。其主要作用有以下几个方面: 1. 提高算法的性能:规范化可以使数据在同一量纲下进行比较,有助于消除数据之间的量纲和单位差异,从而提高算法的性能。 2. 减少数据的重复:在数据规范化的过程中,可以对数据进行去重、去噪和缺失值填充等操作,从而提高数据的质量和准确性。 3. 改善数据可视化效果:规范化可以将数据的取值范围映射到一定的范围内,从而使数据的可视化更加清晰、直观。 4. 方便数据的存储和传输:规范化可以减小数据的存储和传输开销,提高数据的效率和可靠性。 因此,数据规范化是数据分析、机器学习和人工智能等领域中不可或缺的一部分,可以帮助我们更好地理解和处理数据。 ### 回答2: 数据规范化Normalization)是将数据按照一定的规则进行调整和转换,以减少数据中的冗余和重复,并保持数据的一致性和有效性。数据规范化的主要作用如下: 1. 提高数据的一致性:通过规范化,数据被统一整理和调整,使得数据之间的关联更加明确和一致。这样可以避免数据的冲突和矛盾,保证数据的准确性和可靠性。 2. 减少数据冗余:规范化可以消除数据中的冗余信息,避免在数据库中存储相同或相似的数据多次,从而减少了存储空间的开销,提高了数据库的性能和效率。 3. 简化数据操作:通过规范化,数据的结构和格式被统一,使得数据的操作更加简单和方便。规范化后的数据更易于进行查询、更新、删除和插入等操作,提高了数据的可操作性。 4. 提高数据的可维护性和扩展性:规范化可以使数据的结构更加清晰和简洁,减少了数据的复杂度和混乱性。这样可以提高数据的可维护性,使得对数据的改动和调整更加容易。同时,规范化也为数据的扩展提供了更灵活和可行的方式。 总之,数据规范化对于数据的管理和利用非常重要。通过规范化,可以提高数据的一致性和可靠性,减少数据的冗余,简化数据操作,并提高数据的可维护性和扩展性。这些都有助于提高数据管理的效率和质量。 ### 回答3: 数据规范化是指将数据转化为统一的标准形式,以便更好地进行分析和比较。数据规范化的作用主要体现在以下几个方面: 1. 提高数据的一致性:通过数据规范化,可以将不同来源、不同格式的数据转化为统一的格式,使得数据之间具有一致性。这样可以避免数据冗余和错误,提高数据的可靠性和准确性。 2. 简化数据分析:规范化后的数据具有统一的结构和格式,更易于进行数据分析和处理。可以通过对数据进行规范化,将数据转化为能够被常用的数据分析工具和算法所处理的形式,减少数据预处理的工作量。 3. 提高数据比较的准确性:不同数据源的数据往往存在着不同的度量标准和单位,难以进行比较。通过数据规范化,可以将数据进行统一的单位转换和标准化,使得不同数据之间可以进行准确的比较和分析。 4. 降低数据存储和维护成本:数据规范化可以帮助去除数据的冗余和重复,减少存储空间的使用量。同时,规范化后的数据结构更加清晰和简洁,使得数据的维护和更新更加高效和便捷。 5. 改善数据的解释性和可视化效果:规范化后的数据更加符合人类的认知习惯和信息处理方式,易于解释和理解。通过规范化后的数据,可以更好地进行数据可视化和展示,提高数据的可视化效果和信息传递效果。 总的来说,数据规范化在数据管理和分析过程中具有重要作用,帮助提高数据的一致性、可比性和解释性,降低数据维护成本,同时也方便了数据的处理和分析工作。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值