HDP 2.5集成Sqoop2

前言

HDP 2.5默认只有Sqoop 1,而sqoop 1只有客户端,没有服务端,也不能通过Java Api来进行操作,所以需要集成一下Sqoop2,其实这里我们只需要启动Sqoop2的Server端即可。

环境

注:sqoop 1.99.7其实就是Sqoop2

配置

配置很简单,下载好sqoop2后,解压到一个路径,如:/usr/lib/
进入解压后的bin目录中,编辑sqoop.sh文件:
找到function sqoop_server_classpath_set函数,将其中的环境变量该一下就可以了,如下:

function sqoop_server_classpath_set {

HADOOP_COMMON_HOME=${HADOOP_COMMON_HOME:-${HADOOP_HOME}/share/hadoop/common}
HADOOP_HDFS_HOME=${HADOOP_HDFS_HOME:-${HADOOP_HOME}/share/hadoop/hdfs}
HADOOP_MAPRED_HOME=${HADOOP_MAPRED_HOME:-${HADOOP_HOME}/share/hadoop/mapreduce}
HADOOP_YARN_HOME=${HADOOP_YARN_HOME:-${HADOOP_HOME}/share/hadoop/yarn}

将这些环境变量都注释掉,改为下面的内容即可:

function sqoop_server_classpath_set {

 HDP=/usr/hdp/2.5.0.0-1245
 HADOOP_COMMON_HOME=$HDP/hadoop
 HADOOP_HDFS_HOME=$HDP/hadoop-hdfs
 HADOOP_MAPRED_HOME=$HDP/hadoop-mapreduce
 HADOOP_YARN_HOME=$HDP/hadoop-yarn

启动Server

进入sqoop的bin目录下,执行以下命令启动服务端:

# ./sqoop.sh server start

查看是否启动成功
# jps
20611 SqoopJettyServer

如出现SqoopJettyServer进程则表示已启动成功,后面我们就可以通过Java API接口来进行相应的数据导入导出操作了。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Ambari HDP资源是指在Hortonworks Data Platform (HDP) 中使用的Ambari资源。Ambari是一个开源的集群管理平台,用于在Hadoop集群上进行资源和服务的管理。HDP是一个基于开源技术的大数据平台,它提供了一个集成的解决方案,用于存储、处理和分析大规模数据。 Ambari HDP资源主要包括以下几个方面: 1. 主机资源:Ambari HDP资源包括在集群中管理的所有主机资源。这些资源可以是物理服务器、虚拟机或云服务器。通过Ambari可以方便地查看和管理集群中的主机资源,并进行相应的配置和监控。 2. 存储资源:Ambari HDP资源还涉及到集群中的存储资源。这些资源主要是指用于存储和管理大规模数据的存储设备,如HDFS(Hadoop分布式文件系统)。Ambari可以帮助管理员配置和管理存储资源,确保数据的高可用性和可靠性。 3. 服务资源:Ambari HDP资源还包括集群中运行的各种服务的资源,如Hadoop、Hive、Spark等。这些服务是构建在HDP平台上的组件,用于数据处理、分析和查询。通过Ambari,管理员可以轻松地启动、停止和监控这些服务,并进行相应的参数配置和负载均衡。 4. 应用程序资源:Ambari HDP资源还包括在集群中运行的各种应用程序的资源。这些应用程序可以是自定义的MapReduce作业、Spark作业或其他大数据应用。通过Ambari,管理员可以方便地管理和监控这些应用程序,并对其进行调度和优化。 总之,Ambari HDP资源是集群中使用的各种主机、存储、服务和应用程序的资源。通过Ambari平台,管理员可以方便地进行资源的配置、监控和管理,提高集群的性能和可靠性。 ### 回答2: Ambari HDP资源是指通过Ambari管理工具来管理Hortonworks Data Platform(HDP)的各种资源。HDP是一个开源的分布式数据处理平台,它提供了各种处理大数据的工具和技术。 Ambari是Hortonworks开发的一款用于管理和监控Hadoop集群的工具,它可以实现对HDP资源的集中管理。Ambari HDP资源包括了集群中的各个组件,例如Hadoop分布式文件系统(HDFS),YARN资源管理器,HBase,Hive,Spark等。通过Ambari,管理员可以方便地监控每个组件的运行状态,进行配置和维护。 使用Ambari HDP资源,管理员可以轻松地进行集群的扩展和升级。通过Ambari界面,可以添加新的节点到集群中,使其参与到任务的执行中,从而提高集群的处理能力。同时,当需要升级HDP版本时,管理员也可以通过Ambari来进行集群的无缝升级,而不需要手动操作每个节点。 另外,Ambari还提供了一些监控和报警功能,可以实时监控集群的状态。管理员可以通过Ambari配置报警规则,当集群出现故障或者性能下降时,会自动触发报警通知管理员进行处理。 总结来说,Ambari HDP资源是指通过Ambari来管理和监控Hortonworks Data Platform的各个组件和资源,包括了集群的扩展、升级和监控等功能。通过Ambari,管理员可以更加方便地管理大数据处理平台,提高集群的效率和稳定性。 ### 回答3: Ambari HDP 资源是指在使用 Hadoop 分布式计算平台时,通过 Ambari 进行资源管理和监控的相关组件和功能。 Ambari 是一种用于管理和监控 Hadoop 分布式计算平台的开源软件。它提供了一个直观的 Web 用户界面,帮助用户轻松部署、配置、管理和监控 Hadoop 群集。Ambari HDP资源是在该平台上用于管理和监控 HDP (Hortonworks Data Platform) 的相关资源。 HDP 是一种在企业环境中运行 Hadoop 的解决方案。它包含了一系列开源软件组件,如Apache Hadoop、Apache Hive、Apache Spark、Apache HBase等。HDP 提供了对大规模数据处理和存储的支持,帮助用户在分布式环境中高效地存储、管理和分析大数据。 Ambari HDP 资源提供了以下功能: 1. 集群部署和配置:用户可以通过 Ambari HDP 资源对 HDP 群集进行快速和简单的部署和配置。将资源分配到集群中的各个节点,配置相关的参数和选项。 2. 资源管理:Ambari HDP 资源可以帮助用户管理 HDP 群集中的资源。通过 Ambari HDP,用户可以添加、删除和监视 Hadoop 集群的各个节点和服务。 3. 监控和日志:Ambari HDP 资源可以实时监控 Hadoop 集群的状态和性能。它提供了可视化的监控仪表盘,用户可以查看各个节点和服务的健康状况、资源利用率、负载等信息。此外,Ambari HDP 还能够收集和管理 Hadoop 集群的日志信息,帮助用户快速排查和解决问题。 总而言之,Ambari HDP 资源是在使用 Hadoop 分布式计算平台时,通过 Ambari 进行资源管理和监控的相关组件和功能。它简化了 Hadoop 集群的部署、配置和管理过程,提高了群集的可靠性和性能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值