跟我一起总结【数据仓库】之——设计文档检查项

1.枚举值:检查“归集库”字段中文注释,是否包含分号、冒号、顿号、斜杠/反斜杠,数字0,1,2(方便标准层及基础层使用)
检查方法:对“字段名称”查找,截取后放到“枚举值”或“注释”
2.明细表表名命名里包含动词
检查方法:核对后,逐个修改
3.原子信息表“中文表名”需要清楚展现释义
检查方法:形如:【b_st_yz_jjh_基本信息】 需要修改为 【基金会基本信息】
4.字段及注释完整,不含有歧义,不完整需要写清原因
检查方法:对“字段名称”筛选,看是否有空值
5.逻辑模型中字段需要按照逻辑模型字段类型那几个分类写好,与物理模型区分开
检查方法:对“字段类型”筛选,看是否有不符合的分类
6.归集库-标准层尽量做规整,基础层才不会有大的数据结构的返工
检查方法:在归集库-标准层做好一版后,多检查两遍设计之后,在考虑设计中心库
7.标签表结构,需要提取原子信息表和明细表字段,重复数据需要去掉
检查方法:将需要的字段提取出来作对比(数据完整度,考虑合并或者取其一)
8.excel单元格颜色,字体,字号统一
检查方法:全选设定修改
9.相同的字段编码,不能用不同字段名称,相同的字段名称,不同的字段编码(范围:全局)
检查方法:
比如你的数据在A列和B列,那你在C2输入公式:=vlookup(A2,A3:B$100,2,0),在D2输入公式=C2=B2,C2和D2公式下拉填充到底,最后筛选B2中结果是FALSE的。
(上面那个B$100是比如数据有100行,实际需要根据行数进行调整)
其中两列数据相同但是公式匹配不出的,实际数据形如("GPS经度    ",GPS经度),使用分列直接完成。
之后,按照命名标准修改字段名(从标准层开始修改)
参照《数据模型命名规范0722-媛媛》6.5.2第二部分(一位一位的展开)
如果编码重应按照扩展原则扩展,扩展原则不建议加数字,建议从字母上扩展,中文名称相同时建议从语义上扩展
10.标识度量的信息项,例如:<补领号牌次数>如果为字符串类型,需确认原始数据类型,最好设置为数值型
检查方法:每张表逐个排查
11.统一新增的6个字段,其中<业务时间>为日期类型,其他表示时间的用了字符串
检查方法:
若物理数据类型选择timestamp,逻辑模型用日期型;
若物理数据类型选择string、text之类的表示,逻辑模型用字符串;
若物理数据类型选用int之类的表示,逻辑模型用整数。
12.遇到中心库基础层表中的业务含义字段编码命名方式不统一,多种方式混合有汉语全拼,汉语简拼,汉语拼音和英文混合,如:shenhedate
解决方法:基础层统一为拼字首字母
13.数仓设计中“序号”要排列正确
序号列写入公式:=IF(B2=B1,C1+1,1)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值