Apache Atlas2.0 第六节 血源关系

1 )首先看一个效果图

2 )由于使用hdp 进行Atlas集成,所以下面使用的是0.7版本的,亲自验证过的流程,先上一段json, 每两个Table (entity)之间需要一个Process 进行连接,形成一条血缘关系图。首末两端使用 inputs ,outputs进行entity 关联

{
    "entity":{
        "typeName":"Process",
        "attributes":{
            "qualifiedName":"table_03@datag@10.10.66.30",
            "createdBy":"caozqaAPI",
            "createTime":"2017-08-25T13:15:25.369Z",
            "updatedBy":"caozqaAPI",
            "updateTime":"2017-08-25T14:12:45.246Z",
            "name":"table_01",
            "comment":"rdbms_table API insert test",
            "description":"rdbms_table  手动输入",
            "owner":"caozqa",
            "type":"table",
            "contact_info":"table_03_info",
            "inputs":[{
                "guid": "eddcde3c-92a2-4cfc-86d1-6ea43f6497b0",
                "typeName": "rdbms_table"
            }],
            "outputs":[{
                "guid": "f438d921-ff4c-4838-bdca-3b868bbed825",
                "typeName": "rdbms_table"
            }]
        }
    }
}

3)代码中可以找到一个 Process类 ,该类继承自Asset类型,所以自带有name,owner,description,quailifiedName四种属性,它自己特有的inputs和outputs表示该过程的输入输出,它是Atlas血缘管理中所有类型的超类,在概念上,它可以用于表示任何数据变换操作。例如,将原始数据的 hive 表转换为存储某个聚合的另一个 hive 表的 ETL 过程可以是扩展过程类型的特定类型。流程类型有两个特定的属性,输入和输出。输入和输出都是 DataSet 实体的数组。因此,Process 类型的实例可以使用这些输入和输出来捕获 DataSet 的 lineage 如何演变,例如hive_process,sqoop_process 类型,在rdbms中直接使用Process 来存储血缘关系

4) 查询API的方式 采用base 验证  get请求

   http://ip:port/api/atlas/v2/lineage/58182d3b-0777-4297-aae8-949368ef7bc5

 

  • 1
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值