从其他库导入到和hive
mysql
sqoop import --connect jdbc:mysql://172.16.1.151:3306/nova --direct --username nova --password 123456 --table instances --hive-table instances --hive-import -m 1
制定库
sqoop import --connect jdbc:mysql://172.16.1.151:3306/nova --direct --username nova --password 123456 --table instances --hive-database dddd --hive-table instances --hive-import -m 1
注:必须在有mysql的节点上运行,最好在hive服务所在节点上运行
pg
sqoop import --connect jdbc:postgresql://ip/db_name--username user_name --table table_name --hive-import -m 5
整库导入:
sqoop import-all-tables --connect jdbc:mysql://ip:3306/dbname --username user --password password --hive-database abc -m 10 --create-hive-table --hive-import --hive-overwrite
import-all-tables :导入所有表
--connect :连接的url地址
--username:mysql用户名
--password:mysql密码
--hive-database:导入到hive的数据库
-m:指定几个map任务,如果没有主键,只能有一个map 例如:-m 1
--create-hive-table :创建表,如果不创建表,hive里是没有表的。
--hive-import:导入数据到hive里
--hive-overwrite :覆盖导入
通过 -m 1
控制并发的 map 数
文件上传到表
sqoop --options-file /users/homer/work/import.txt --table TEST