Sqoop基本操作,待补充
1.导入到hdfs
sqoop import \
--connect jdbc:mysql://localhost:3306/sys \
--username user \
--password pw \
--table table_name \
--target-dir hdfs_path \
--delete-target-dir \
--num-mappers 1\
--fields-terminated-by "指定分隔符"
--query 'sql语句 and $CONDITIONS'
2.导入到hive
sqoop import \
--connect jdbc:mysql://localhost:3306/scm \
--username user \
--password pw \
--table table_name \
--num-mappers 1 \
--hive-import \
--fields-terminated-by "指定分隔符" \
--hive-overwrite \
--hive-database h_db_name \
--hive-table h_table_name
3.显示数据库和表
1)列出mysql数据库中的所有数据库命令
sqoop list-databases \
--connect jdbc:mysql://localhost:3306/ \
--username user \
--password pw \
2)连接mysql并列出数据库中的表命令
sqoop list-tables \
--connect jdbc:mysql://localhost:3306/db_name \
--username user \
--password pw \
针对oracle的操作,CDH是没有oracle的驱动包的。
点这里拿驱动包
提取码:8s74
注意点:
–connect jdbc:oracle:thin:@172.16.109.96:1521:LPSQLQRY
这里的和mysql有差别,我当初就因为“@”找了好久的错,还有就是驱动包要放到/usr/share/java/,sqoop默认是会去这下面找相关jar包的。