一、定义初始表结构
i. 从检查初始字段列表开始,找出隐藏说明的主题,这时要摒弃对调研过程中熟悉的主题的偏爱,客观地观察。分辨字段说明了哪些特定的主题(有可能就是隐藏的主题)。识别尽量多的主题,形成一个初始表列表。
ii. 与主题列表对比,处理重复项目;处理代表同一主题的不同项目(往往是取名 问题);合并两张表中的项目。
iii. 使用任务目标,用来判断前面的过程是否遗漏了说明主题。使用主题识别技术,通过对有下划线的项目名称它的内涵的理解来判断是否已经出现在初始表列表里面。
二、定义最终表结构
a) 最终表多了两个项目:表类型与描述。表类型有:数据表,连接表,子集表,验证表表描述对该表所代表的主题给出了一个清晰的定义,并说明了它对于单位的重要性。
b) 表名求精
i. 要对单位有意义的、唯一的、描述性的名字
ii. 能够准确、清晰、无二义性的标识该表主题的名字(避免使用“杂项”)
iii. 用最少的字
iv. 不要使用表达物理特征的词。比如说“文件”,“表”(可以拆分为更多的主题)
v. 不用缩写
vi. 不要使用不恰当的专有名词。可能会限制,影响以后的发展(如“西南地区雇员”)
vii. 不要使用隐式或显式地标识多个主题的名字("\"