SpringBoot集成Atlas之二(创建血缘关系)

Atlas集成详见:

SpringBoot集成Atlas之一

Atlas的血缘关系描述属于Atlas实体,血缘关系属性实体类型为AtlasBaseTypeDef.ATLAS_TYPE_PROCESS:Process。

创建时指定input,output属性即可。

1、创建血缘


/**
 * 元数据客户端实现--同步Atlas元数据
 * 主要功能:同步元数据
 */
@Component
public class MetaClient {
	......

    public AtlasEntity queryAtlasEntity(String guid) {
        try {
            AtlasEntity.AtlasEntityWithExtInfo entityWithExtInfo = atlasClientV2.getEntityByGuid(guid, true, false);
            return entityWithExtInfo.getEntity();
        }catch (AtlasServiceException e) {
            e.printStackTrace();
        }
        return null;
    }

    /**
     * 依据DTO创建血缘
     * @param lineAgeCreateDTO
     */
    public void createLineAge(LineAgeCreateDTO lineAgeCreateDTO) {
        MetadataDatabase srcMetadataDatabase = metadataDatabaseService.getByTableEntityId(lineAgeCreateDTO.getSourceGuid());
        MetadataDatabase dstMetadataDatabase = metadataDatabaseService.getByTableEntityId(lineAgeCreateDTO.getSourceGuid());
        if(srcMetadataDatabase==null || dstMetadataDatabase == null) {
            throw new ServiceException("找不到源表所在库和目标表所在库");
        }
        createLineAge(srcMetadataDatabase.getCatalogName(), lineAgeCreateDTO.getSourceGuid(),lineAgeCreateDTO.getSourceTable(),dstMetadataDatabase.getCatalogName(), lineAgeCreateDTO.getTaregetGuid(),lineAgeCreateDTO.getTargetTable());
    }

    /**
     * 原始参数创建血缘
     * @param sourceGuidId
     * @param sourceQualifier
     * @param targetGuid
     * @param targetQualifier
     */
    public void createLineAge(String sourceDb,String sourceGuidId,String sourceQualifier,String targetDb,String targetGuid,String targetQualifier) {
        if(StringUtils.isEmpty(sourceGuidId)) {
            return;
        }
        if(StringUtils.isEmpty(targetGuid)) {
            return;
        }
        AtlasEntity sourceEntity = queryAtlasEntity(sourceGuidId);
        AtlasEntity targetEntity = queryAtlasEntity(targetGuid);
        if(sourceEntity==null || targetEntity==null) {
            throw new ServiceException("创建血缘关系失败:"+"源或目标不存在");
        }
        AtlasEntity lineage = new AtlasEntity();
        //设置为process类型构建血缘
        lineage.setTypeName(AtlasBaseTypeDef.ATLAS_TYPE_PROCESS);
        Map<String, Object> attributes = new HashMap<>();
        //获取数据源信息,组成qualifiedName
        String qualifiedName = sourceDb+"."+sourceQualifier+"-"+targetDb+"."+targetQualifier;
        attributes.put("qualifiedName", qualifiedName);
        attributes.put("name", sourceQualifier+"-"+targetQualifier);
        attributes.put("description", sourceDb+"."+targetQualifier+" 的数据来自 "+ targetDb+"."+sourceQualifier);
        attributes.put("inputs", getLineAgeInfo(sourceEntity));
        attributes.put("outputs", getLineAgeInfo(targetEntity));
        lineage.setAttributes(attributes);

        Map<String, String> queryAttributes = new HashMap<>();
        queryAttributes.put("qualifiedName", qualifiedName);
        try {
            //查询是否存在
            atlasClientV2.getEntityByAttribute(AtlasBaseTypeDef.ATLAS_TYPE_PROCESS, queryAttributes);
        } catch (AtlasServiceException e)  {
            if(e.getStatus().getStatusCode()==404 || "Not Found".equals(e.getStatus().getReasonPhrase()) ) {
                //创建
                AtlasEntity.AtlasEntityWithExtInfo extInfo = new AtlasEntity.AtlasEntityWithExtInfo(lineage);
                try {
                    atlasClientV2.createEntity(extInfo);
                }catch (AtlasServiceException e2) {
                    e.printStackTrace();
                    throw new ServiceException("未知错误:"+e2.getMessage());
                }
            }else {
                e.printStackTrace();
                throw new ServiceException("未知错误:"+e.getMessage());
            }
        }

    }

    //构建inputs和outputs
    private static List<Map<String, String>> getLineAgeInfo(AtlasEntity entity) {
        List<Map<String, String>> list = new ArrayList<>();
        Map<String, String> map = new HashMap<>();
        map.put("guid", entity.getGuid());
        map.put("typeName", entity.getTypeName());
        list.add(map);
        return list;
    }


}

2、接口调用

    @Operation(    summary = "生成atlas血缘元数据" )
    @PostMapping({"/createLineAge"})
    public ResponseJson createLineAge(@RequestBody LineAgeCreateDTO lineAgeCreateDTO) {
        try {
            metaClient.createLineAge(lineAgeCreateDTO);
            return ResponseJson.success("同步成功");
        }catch (Exception e) {
            e.printStackTrace();
            return ResponseJson.success("同步失败!");
        }

    }

  • 6
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 为了在CDH 6.3.2中集成Apache Atlas 2.1.0,需要按照以下步骤进行操作: 1. 准备工作: - 确保CDH集群已经安装和配置成功,并且可正常运行。 - 下载并解压Apache Atlas 2.1.0安装包,并将其上传到CDH集群的某一台主机上。 2. 配置Atlas: - 进入Atlas安装包的目录,编辑conf/atlas-env.sh文件,设置ATLAS_HOME和ATLAS_LOG_DIR变量。 - 编辑conf/atlas-application.properties文件,设置配置选项,如atlas.graph.index.search.backend=lucene和atlas.audit.hbase.tablename=ATLAS_HOOK。 - 如果需要使用LDAP进行用户身份验证,编辑conf/atlas-application.properties,设置atlas.authentication.method=LDAP,并配置相关的LDAP连接参数。 3. 配置Hadoop集成: - 进入CDH的HDFS配置目录,例如/etc/hadoop/conf.cloudera.hdfs/。 - 编辑hdfs-site.xml文件,在其中添加以下配置: ``` <property> <name>dfs.namenode.acls.enabled</name> <value>true</value> </property> <property> <name>dfs.namenode.acls.enabled</name> <value>true</value> </property> ``` - 重新启动HDFS服务,使配置生效。 4. 初始化Atlas: - 切换到Atlas安装包目录,运行bin/atlas_start.py脚本以启动Atlas服务。 - 运行bin/atlas_client.py脚本,执行create-hbase-schema命令初始化HBase表结构。 - 运行bin/atlas_client.py脚本,执行import-hive.sh命令初始化Hive元数据。 - 最后,运行bin/atlas_client.py脚本,执行import-hdfs.sh命令初始化HDFS元数据。 完成以上步骤后,CDH 6.3.2与Apache Atlas 2.1.0就成功集成起来了。Atlas将能够提供数据治理和元数据管理的功能,同时与CDH集群的各个组件相互交互,提供更加全面和可靠的数据管理支持。 ### 回答2: CDH 6.3.2是一种大数据平台,集成了各种开源的大数据软件,包括Hadoop、Hive、Spark等。而Atlas 2.1.0则是一种开源的元数据管理和数据治理平台。 将CDH 6.3.2与Atlas 2.1.0集成,可以为大数据平台提供更全面和高效的元数据管理功能。具体的集成步骤如下: 1. 下载和安装CDH 6.3.2:首先,需要从Cloudera官网下载CDH 6.3.2的安装包,并按照官方说明进行安装配置。 2. 下载和安装Atlas 2.1.0:接下来,需要从Apache Atlas官网下载Atlas 2.1.0的安装包,并按照官方说明进行安装配置。 3. 配置Atlas与CDH集成:在安装完成之后,需要修改CDH的配置文件,以便与Atlas集成。通过编辑Cloudera Manager的配置文件,将Atlas的相关配置信息添加进去,配置包括Atlas的运行路径、端口号等。 4. 启动Atlas服务:Atlas服务是一个后台服务,负责元数据管理功能。设置完成后,需要启动Atlas服务,以便使之在CDH平台上生效。通过Cloudera Manager界面,找到Atlas服务,并启动它。 5. 验证集成效果:在Atlas服务启动后,可以登录Atlas的Web界面,验证集成效果。在Atlas中,可以添加和管理各种元数据,比如数据表、数据列等。通过Atlas,可以方便地搜索和浏览CDH中的元数据信息,实现数据治理的目标。 总的来说,将CDH 6.3.2与Atlas 2.1.0集成可以提升大数据平台的元数据管理和数据治理能力。通过将两者集成,可以更方便地管理和查询各种元数据信息,为数据分析和挖掘提供更好的支持。 ### 回答3: CDH 6.3.2 是Cloudera提供的开源大数据平台,而Atlas 2.1.0 是Apache Atlas 提供的元数据管理和数据治理工具。要将Atlas 2.1.0 集成到CDH 6.3.2 中,需要按照以下步骤进行操作: 1. 安装CDH 6.3.2:首先,需要按照Cloudera官方文档提供的指南,从Cloudera官方网站下载并安装CDH 6.3.2。这个过程需要确保与系统的要求相符,包括硬件要求和操作系统版本等。 2. 安装Apache Atlas 2.1.0:接下来,需要从Apache Atlas官方网站下载并安装Atlas 2.1.0 的二进制包。同样,这个过程也需要根据官方文档中的指南进行操作,确保安装过程正确无误。 3. 配置CDH 6.3.2 和Atlas 2.1.0:一旦安装完毕,需要进行CDH和Atlas的配置。首先,需要编辑CDH 6.3.2 的配置文件,将Atlas相关的配置选项添加进去,并指定Atlas的元数据存储位置。然后,需要启动CDH的服务,包括Hadoop、Hive、HBase等。接着,在Atlas的配置文件中,需要指定Hadoop集群的地址和端口等信息。 4. 启动Atlas 2.1.0:配置完成后,可以启动Atlas 2.1.0 服务。这样,Atlas将能够连接到CDH 6.3.2,并开始收集、管理和治理集群中的元数据。 需要注意的是,由于CDH和Atlas都是复杂而庞大的系统,集成过程中可能会遇到各种问题和挑战。因此,在进行集成之前,确保事先熟悉了官方文档,并参考经验丰富的用户或社区中的指南和建议。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值