(15)Sqoop安装

.1 下载并解压
1 )下载地址: http://mirrors.hust.edu.cn/apache/sqoop/1.4.6/
2 )上传安装包 sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz hadoop102 /opt/software 路径中
3 )解压 sqoop 安装包到指定目录,如:
[atguigu@hadoop102 software]$ tar -zxf sqoop-1.4.6.bin__hadoop-
2.0.4-alpha.tar.gz -C /opt/module/
4 )解压 sqoop 安装包到指定目录,如:
[atguigu@hadoop102 module]$ mv sqoop-1.4.6.bin__hadoop-2.0.4-
alpha/ sqoop
2.3.2 修改配置文件
1) 进入到 /opt/module/sqoop/conf 目录,重命名配置文件
[atguigu@hadoop102 conf]$ mv sqoop-env-template.sh sqoop-env.sh
2) 修改配置文件
[atguigu@hadoop102 conf]$ vim sqoop-env.sh
增加如下内容
export HADOOP_COMMON_HOME=/opt/module/hadoop-3.1.3
export HADOOP_MAPRED_HOME=/opt/module/hadoop-3.1.3
export HIVE_HOME=/opt/module/hive
export ZOOKEEPER_HOME=/opt/module/zookeeper-3.5.7
export ZOOCFGDIR=/opt/module/zookeeper-3.5.7/conf
2.3.3 拷贝 JDBC 驱动
1 )将 mysql-connector-java-5.1.48.jar 上传到 /opt/software 路径
2 )进入到 /opt/software/ 路径,拷贝 jdbc 驱动到 sqoop lib 目录下。
[atguigu@hadoop102 software]$ cp mysql-connector-java-
5.1.48.jar /opt/module/sqoop/lib/
2.3.4 验证 Sqoop
我们可以通过某一个 command 来验证 sqoop 配置是否正确:
[atguigu@hadoop102 sqoop]$ bin/sqoop help
出现一些 Warning 警告(警告信息已省略),并伴随着帮助命令的输出:
Available commands:
codegen Generate code to interact with database
records
create-hive-table Import a table definition into Hive
eval Evaluate a SQL statement and display the
results
export Export an HDFS directory to a database table
help List available commands
import Import a table from a database to HDFS
import-all-tables Import tables from a database to HDFS
import-mainframe Import datasets from a mainframe server to
HDFS
job Work with saved jobs
list-databases List available databases on a server
list-tables List available tables in a database
merge Merge results of incremental imports
metastore Run a standalone Sqoop metastore
version Display version information
2.3.5 测试 Sqoop 是否能够成功连接数据库
[atguigu@hadoop102 sqoop]$ bin/sqoop list-databases --connect
jdbc:mysql://hadoop102:3306/ --username root --password 000000
出现如下输出:
information_schema
metastore
mysql
oozie
performance_schema
2.同步策略
数据同步策略的类型包括:全量同步、增量同步、新增及变化同步、特殊情况
全量表:存储完整的数据。
增量表:存储新增加的数据。
新增及变化表:存储新增加的数据和变化的数据。
特殊表:只需要存储一次。
3.全量同步策略

 

4.增量同步策略

5.新增及变化策略

 6.特殊策略

某些特殊的维度表,可不必遵循上述同步策略。
1 )客观世界维度
没变化的客观世界的维度(比如性别,地区,民族,政治成分,鞋子尺码)可以只 存一
份固定值。
2 )日期维度
日期维度可以一次性导入一年或若干年的数据。

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

大数据开发工程师-宋权

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值