sqoop的安装和原理

本文介绍了如何在Linux环境下安装Sqoop,并详细讲解了Sqoop数据导出的语句配置,包括连接数据库、指定用户名、密码、表名、HDFS目标路径等关键参数。同时,文章提到了 Sqoop 导入数据时对主键和条件语句的使用规则,以及如何将数据从MySQL导入到Hive中。
摘要由CSDN通过智能技术生成
Sqoop 是一款数据迁移的工具,可以从 mysql等数据库迁移到 hdfs 里面 ,依赖 yarn 和 hdfs,如果服务器上面有$HADOOP_HOME这个变量,sqoop会自动去读取这个值来寻找yarn和namenode,安装在一台节点机上面就可以了

安装
tar -xvf sqoop-1.4.4.bin__hadoop-2.0.4-alpha.tar.gz -C /home/hadoop/ 解压

cp /tmp/mysql-connector-5.1.8.jar ./sqoop-1.4.4.bin__hadoop-2.0.4-alpha/lib/ 拷贝mysql的连接jar包到lib目录下面

导出语句:

./sqoop import --connect jdbc:mysql://192.168.1.100:3306/test --username root --password root --table student --target-dir /student2 -m 2 --fields-terminated-by '|' --columns "id,name";

Import 是导出
–Connect 是连接数据库
–username 用户名
–password 密码
–table 表面
红色test是数据库名称
–target-dir 是hdfs路径
-m 是启动多少一个mapping
-fields-terminated-by 指定分隔符
–columns 知道需要导出的列

如果这个表没有主键,那么个-m 只能指定是1

./sqoop import --connect jdbc:mysql://192.168.1.100:3306/test --username root --password root --table student --target-dir /student2 -m 2 --fields-terminated-by '|' --columns "id,name" --where 'id>2 and id<=5';

–where 是条件
如果是有where –m就会失去作用


                
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值