数据层次的概念:
数据层次是表达数据的一种重要关系,在数据库的设计中,如:组织结构分解、工作任务分解、行政区划的分解等都是层次关系数据的典型实例。
表达层次关系的数据一般需要实现如下属性:
1.层次的最大级联层次数。如:中国->湖南省->长沙市->雨花区,就是4层。
2.能反映同一层次之间的顺序关系。如:长沙市 必须在 衡阳市的前面,(因为其是省会)。
3.能获取任意层次的父节点级子节点(子节点集)。
4.直接获取任意层次的数据。比如:第三层 市级别的数据。
5.能方便构造层次关系表达树。
6.层次结构及排序方式的改变不影响其其他数据的内部逻辑关系。
一般有三种方式来表现层次关系的数据:
1.建立多个数据库表:
如: COUNTRY: ID(主键) COUNTRY_NAME
PROVINCE: ID(主键) COUNTRY_ID(外键),PROVINCE_NAME
CITY: ID(主键), PROVINCE_ID(外键),CITY_NAME
此种方式比较简单,但设计的灵活性不够,数据处理起来比较麻烦。
2.采用表的自关联外键引用
如: DISTRICT_INFO: ID(主键),PARENT_ID,(外键)DISTRICT_INFO
通过外键(PARENT_ID)的自身引用主键(ID)来确立层次关系。
优点:无限级别的层次关系,扩充性强。对于Oracle数据库来说,能简单通过 Start With,,,Connect By--语句来实现数据的查询。
缺点:不能明确看出层次关系,无法实现排序。
3.采用编码方式来实现层次
DISTRICT: ID,CODE,NAME 其中CODE的特点是上级编码是下级编码的前缀
优点:通过编码的内容能够很容易回去数据的层次关系。
缺点:使用Like方法或函数查询来实现子集的查找,效率较低,能实现层次关系的级数有限(受CODE的字段长度影响)。
优化方案:
集合2,3的优点,采用固定编码级次的长度的方法来设计表。
DISTRICT:ID,CODE,PARENT_ID,NAME
其中ID为主键,CODE:规定为4位一级。表现的数据如下:
ID,CODE PARENT_ID, NAME
1 0001 中国
2 00010001 1 湖南
3 000100010001 2 衡阳
4 000100010002 2 长沙
5 0001000100020001 4 雨花
从数据中可以看出,PARENT_ID可以直观表达层次的上下级关系
而编码CODE可以直观表达层次关系与同一层次的顺序关系。