hadoop 元数据管理 atlas

Atlas是一组可伸缩和可扩展的核心基础治理服务——使企业能够有效地满足Hadoop中的遵从性需求,并允许与整个企业数据生态系统集成。Apache Atlas为组织提供了开放的元数据管理和治理功能,以构建数据资产目录,对这些资产进行分类和治理,并为数据科学家、分析师和数据治理团队提供围绕这些数据资产的协作功能。

 

type system

1.type

   type类似java 的类,定义元数据兑现的特殊类型

   atlas 自定义的type 有几种 : DataSet(继承自Referenceable 如hive_db,hive_table都是这种类型)

                                                   Referenceable(这种类型代表所有可以用一个唯一特征qualifiedName搜索的所有entity)

                                                   Asset(继承自Referenceable 此类型扩展了Referenceable,并添加了诸如名称,描述和所有者之类的属性。名称是必填属性(isOptional = false),其他是可选属性。Referenceable和Asset的目的是为建模者提供一种在定义和查询自己类型的实体时强制保持一致性的方法。拥有这些固定的属性集后,应用程序和用户界面就可以根据约定对默认情况下可以期望的类型做出哪些假设。)

                                                   Infastructure(继承自Referenceable  如clusters hosts)

                                                   process(继承自asset 用来表示任何数据转换  例如从一个hive表转换成另一个hive表 process 有input和output,input和output都是dataset类型 因此利用process可以捕获dataset血缘)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值