一,项目背景
最近要做个数据仓库,以前也参与过类似的项目,根据自己的印象,大概做点设计。这个项目的思路很好理解,就是在基层建立一个数据仓库,实现数据在区县-街道-社区之间的三级贯穿。目前一体化平台有大量的数据,但是只是归集,没有做处理;就相当于给了你一座金矿,但是你不会挖。为了解决这个问题,有两种方法,一是建立一个数据仓库,在其中建设很多主题库,把这些涉及到同一个人的数据都关联聚类起来,再把这些应用到场景里面去,那上层的应用就可以使用这些有价值的数据了。也还有第二种方法,你只要对这些表格很熟悉,设计几个功能齐全的sql,想要的数据都能找到,那问题也都解决了。
建设数据仓库的意义有2点:
1,可以持续维持数据的动态更新,一份表格丢入一体化以后,会自动完成抽取-清洗-加载(ETL)的过程,这样可以持续保持数据的鲜活。
2,换个管理员,也能轻松接手。
项目基本的建设内容分为2块:
1,数据仓,标准的数据仓库,设置人口、房屋、企业、事件、物联网设备、统一地址等基础信息主题库。建立一些场景,疫情防控,共同富裕,智能亚运、信用体系、营商环境、基层减负、住房保障一类的。
2,区街社,其实就是增加一个地址字段,说明这条数据是属于哪个街道哪个社区的。从现实意义上看,价值比较大;从技术角度看,没难度&#