数据迁移框架sqoop

数据迁移框架sqoop

一、启动Hadoop集群并连接测试

1.1 查看并启动Zookeeper服务
在这里插入图片描述
1.2 在主节点启动Hadoop集群
在这里插入图片描述
1.3 在备用节点启动ResourceManager
在这里插入图片描述
1.4 在主节点启动Hbase集群
在这里插入图片描述
1.5 分别在主节点、备用节点和数据节点用“jps”查看Jvav进程信息
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
1.7 启动MySQL
①启动管理节点
在这里插入图片描述
②启动数据节点
在这里插入图片描述
③启动SQL节点
在这里插入图片描述
1.7使用Sqoop测试与MySQL的连通
在这里插入图片描述
在这里插入图片描述
二、使用Sqoop
1、使用Sqoop导入MySQL数据到HDFS
在这里插入图片描述
在这里插入图片描述
使用指定的分隔符
在这里插入图片描述
在这里插入图片描述
导入指定条件的数据
在这里插入图片描述
在这里插入图片描述
导入指定查询语句的数据
在这里插入图片描述
在这里插入图片描述
2、使用Sqoop导出HDFS数据到MySQL
准备导出表
在这里插入图片描述
创建要导出文件的位置,并导出所有字段
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
创建要导出文件的位置,导出指定字段
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
创建要导出文件的位置,导出表时指定分隔符
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
批量导出
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
3、使用Sqoop导入MySQL数据到Hive
3.1 导入表的所有字段到Hive
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
(1)创建Hive表
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
4、将常用的Sqoop脚本定义成作业,方便其他人调用
首先启动sqoop,并查看Java进程信息
在这里插入图片描述
4.1创建数据库连接
在这里插入图片描述
在这里插入图片描述
4.2建立HDFS文件系统连接
在这里插入图片描述
4.3 在HDFS创建用于存放导出的数据文件的目录
在这里插入图片描述
在这里插入图片描述
4.4 创建数据传输事务
在这里插入图片描述
在这里插入图片描述
4.5 启动数据传输事务,并查看事务当前的运行进度
在这里插入图片描述
在这里插入图片描述
4.6 查看导出的数据文件列表和导出的数据信息
在这里插入图片描述
4.7通过访问http://192.168.10.111:8088/查看集群状态、日志信息等:
在这里插入图片描述
遇到错误及解决方法:
(1)测试与mysql互通性出现如下错误
在这里插入图片描述
原因:缺少相关的jar包,在sqoop的lib目录下加入所缺jar包(avro-1.8.1.jar),问题解决
在这里插入图片描述
(2)执行导入命令出错,原因:缺少common lang3的jar包,在sqoop的lib目录下加入所缺jar包,如下所示,问题解决
在这里插入图片描述
(3)数据从MySql导入Hive出错,原因:缺少hive相关的jar包,在sqoop的lib目录下加入所缺jar包(hive-common-2.1.1.jar),问题解决

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值