数据分层

1.数据计算层

01.数据计算层-主要考虑方面
	计算平台:离线数据计算 实时数据计算
	管理:元数据模型整合和应用、
		数据表的规范命名
		存储元数据:
		运行数据:

2.计算的数据分层:数据加工链路

	01.ODS--数据计算层,这一层作为原始数据层
		目前命名 qmc_da   qmc-dc qmc_dd
		以后的命名方式
	02.CDM层--
		DWD层-公共明细层
		DWS层- 公共汇总层
	03.ADS层
		应用层-- MySQL以及HBase
   说明:
	操作数据层--也就是我们放在Hive中的源表
	公共维度模型层:
		这层的话,我们是没有计算的
		这层的话,会把一些维度--采用维度退化的方式吧数据放到		明细事实表中,减少计算的关联
		  主要是复用关联,减少数据的扫描
	应用数据层: 这层是根据ODS直接计算得出的,以后可以根据ODS层以及CDM层计算出来

2.需要考虑的问题

01.ODS层
	Hive目前采用的是内部表,存在误删除的潜在风险,容易造成数据丢失。可以加强的手段是权限控制。
	目前考虑是否改成外部表,
		如果有操作失误,比如删表之类的操作,外部表只删除元数据,不涉及处理后的源数据
02.CDM层的相关内容
   CDM层这层目前没有,是把应用层往下移,还是怎么处理?
   目前分层的情况,是否需要考虑之前的数据的迁移改变,还是说老表老办法,新表新办法,
   CDM层的考虑的问题
   01.数据是否分库以及如何分库
   02.维度表的处理-
       提取公共维度表
       维度表中--把用户的原始数据推断出的新维度计算出来
       缓慢变化维的处理方式:同一ID对应的维度值变化,是采用哪些方式处理
        新增字段的处理
   03.对流量表中常见的业务的处理
   	明细是否要将一些维度加在内?
   	明细的结构--如何抽象出
	明细的计算:如何确保本层数据计算执行的稳定性以及故障发现和恢复
   04.CDM确定的原则和方法
    原则:
    	高内聚和低耦合
    	核心数据和扩展数据--数据分安全和价值等级
    	命名规范-易于开发和使用
    方法:维度建模
    步骤
    	需求调研--
    	           一是和业务人员沟通,
    				二是对目前报表以及数据营销平台的报表进行分析
    			确定根据什么汇总,以及汇总哪些数据-明细和汇总数据如何设计
    	模型设计:
    		……
    		推断信息加入到原始流量表中--例如用户的年龄
    		事实表--维度退化
    关于维度表
    	方式一:
    	   如两三个表都有产品名这个维度,提出来。维度key,和对应的维度值
    	    相应的字段- 表,维度和维度对应的key值
    		例如:
    			 表	维度key	维度Value
    		    act	productName  ltcp
    			act	productName  yccp
    			act	platform			iOS
    			….
    	方式二:
    		维度类型
    			维度类型	维度子ID 维度父ID
    			1	ltcp3     lt
    			1	ltcp5     lt
    			1	yccp      yc		    	

3.使用的方式:

数据调用服务--优先使用CDM数据,当这层没有的时候,评估是否需要创建,如果不需要,再使用ODS层

4.附录:

01.名词术语解释:
  ODS <Operational Data Store> 操作数据层
  CDM<Common Dimension Model > 公共维度模型层
	DWD<Data Warehouse Detail>明细数据层
	DWS<Data WareHouse Summary> 汇总数据层
  ADS<Application Data Store> 应用数据层
02.维度建模

03.规范定义
	表命名规范

特殊情况的考虑

缓慢变化维(Slowly Changing Dimensions)

指的是:维度表里面的数据并非是始终不变的,总会随着时间发生变化。
缓慢渐变类型一 (Type 1 SCD):

在数据仓库中,我们可以保持业务数据和数据仓库中的数据始终处于一致。可以在 Customer 维度中使用来自业务数据库中的 Business Key - CustomerID 来追踪业务数据的变化,一旦发生变化那么就将旧	的业务数据覆盖重写。

缓慢渐变类型二 (Type 2 SCD):

当然在数据仓库中更多是对相对静态的历史数据进行数据的汇总和分析,因此会尽可能的维护来自业务系统中的历史数据,能够真正捕获到这种历史数据的变化。比如用户手机号,而应该新增加一条数据来说明现在 手机号, 同时保留以前的手机号。

缓慢渐变类型三 (Type 3 SCD):

实际上 Type 1 and 2 可以满足大多数需求了,但是仍然有其它的解决方案,比如说 Type 3 SCD。 Type 3 SCD 希望只维护更少的历史记录,比如说把要维护的历史字段新增一列,然后每次只更新 Current Column 和 Previous Column。这样,只保存了最近两次的历史记录。但是如果要维护的字段比较多,就比较麻烦,因为要更多的 Current 和 Previous 字段。所以 Type 3 SCD 用的还是没有 Type 1 和 Type 2 那么普遍。  

转载于:https://my.oschina.net/sunmin/blog/3035519

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: GIS是一种空间数据处理和分析工具,而shp数据则是GIS中最为常见的操作格式,其可以支持多种空间数据的存储和管理。分层也是GIS中的一种常见操作,可以有效地将数据按照不同层次进行分类和管理。 首先,GIS中的shp数据可以通过分层来管理。通过将数据按照不同的层次进行分类存储,可以提升数据的管理效率,同时也能更加方便使用和处理数据。这种分层管理方式不仅可用于不同空间数据的分类,也可以应用于属性数据的管理。 其次,通过数据分层,可以方便地进行数据的组合和分析。因为分层数据按照不同的层次进行分类,每一层数据之间都有其内部的关系和特征,这样就可以方便进行数据的组合和拼接。而当需要进行数据分析时,也可以将不同层次的数据进行分类,分别进行分析和比较。 最后,分层还可以为数据可视化提供支持。随着数据量的增加,数据的可视化变得越来越重要,通过将数据进行分层,可以将复杂的数据结构简化为易于理解的数据图层,更加方便进行数据可视化和地图制作。 总之,GIS shp数据分层是一种非常常见和实用的操作,它可以提高数据管理效率、方便数据的分析和管理、及数据的可视化,是GIS操作中的一项重要技术。 ### 回答2: GIS shp数据分层指的是将一个大的空间数据集按照不同的层次进行划分和组织,使得数据的结构化程度更高,方便数据的管理和应用。 在GIS中,shp文件是一种矢量数据格式,它通常包含点、线和面等多种几何形状对象,以及与这些对象有关的属性信息。而分层是指通过对这些空间对象进行分类和筛选,将其划分为不同的数据层,每个数据层包含一定类别的对象,如道路、河流、建筑物等。 通过分层,可以实现对空间数据的分类和组织,便于对数据进行管理和利用。在GIS应用中,常常需要使用多个数据层进行叠加分析,以获取更为丰富的信息。 例如,在城市规划中,通过将建筑物、道路、河流等空间对象分别划分到不同的层级,可以对每个层级进行独立的分析和处理,以支持城市规划的决策和管理。在资源管理中,将森林、草原、湖泊等不同的生态系统划分到不同的数据层中,可以帮助管理者更清晰地了解各个生态系统的现状和变化趋势,从而制定更为有效的管理方案。 总之,GIS shp数据分层是一种将多个空间对象按照类别进行管理和组织的方法,具有重要的数据管理和分析价值,在GIS应用中得到了广泛应用。 ### 回答3: GIS中的shp数据分层是指将一个大的地理区域按照某种分类或标准进行分层,并将其转化为shp文件格式的功能。在GIS中,分层可以按照多个维度进行,比如按照行政区划、气候分区、土壤类型等划分。这样做的好处是将数据按照不同层级进行分层,便于管理、维护和分析,同时也可以在制作地图时根据需要选择不同的层级进行展示。 在进行shp数据分层时,需要先确定分层的标准和分类方法。例如,如果按照行政区划进行分层,可以以省为第一层,再按照市、县、乡、村等逐层展开。如果按照气候分区进行分层,则可以以温带、热带、寒带等为第一层,再按照降雨量、温度等因素逐层展开。 在确定了分层标准后,需要利用GIS软件进行数据分层。首先需要导入原始数据,在GIS软件中选择分层工具进行分层,将数据按照之前确定的标准进行分类,最终生成各个层级的shp文件。 总之,shp数据分层是一项非常重要的GIS数据管理和展示功能。它可以将大量地理数据按照不同维度进行分类和管理,帮助用户更加清晰地了解和展示地理信息。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值