不久之前,我一直在阅读
SQL and Relational Theory by C. J. Date一书.作者因批评sql的三值逻辑(3VL)而闻名.1)
作者强调了为什么在sql中应该避免使用3VL,但他没有概述如果不允许使用可空列的数据库模型的样子.我已经考虑了一下,并提出了以下解决方案.如果我错过了其他设计方案,我想听听他们的意见!
1)日期对sql 3VL的批评反过来也受到批评:见this paper by Claude Rubinson(包括C. J. Date的原始批评).
示例表:
作为示例,请使用下表,其中我们有一个可为空的列(DateOfBirth):
# +-------------------------------------------+
# | People |
# +------------+--------------+---------------+
# | PersonID | Name | DateOfBirth |
# +============+--------------+---------------+
# | 1 | Banana Man | NULL |
# +------------+--------------+---------------+
选项1:通过标志和默认值模拟NULL:
不是使列可为空,而是指定任何默认值(例如1900-01-01).另一个BOOLEAN列将指定是否应该简单地忽略DateOfBirth中的值或者它是否实际包含数据.
# +------------------------------------------------------------------+
# | People' |
# +------------+--------------+----------------------+---------------+
# | PersonID | Name | IsDateOfBirthKnown | DateOfBirth |
# +============+--------------+----------------------+---------------+
# | 1 | Banana Man | FALSE | 1900-01-01 |
# +------------+--------------+----------------------+---------------+
选项2:将可为空的列转换为单独的表:
可空列由新表(DatesOfBirth)替换.如果记录没有该列的数据,则新表中将不会有记录:
# +---------------------------+ 1 0..1 +----------------------------+
# | People' | | DatesOfBirth |
# +------------+--------------+ +------------+---------------+
# | PersonID | Name | | PersonID | DateOfBirth |
# +============+--------------+ +============+---------------+
# | 1 | Banana Man |
# +------------+--------------+
虽然这似乎是更好的解决方案,但这可能会导致需要为单个查询加入许多表.由于不允许OUTER JOIN(因为它们会在结果集中引入NULL),所以可能不再像以前那样只使用一个查询来获取所有必需的数据.
题:
是否有其他选项可以消除NULL(如果是,它们是什么)?