1.导入语句
注意:该语句未指定hive-table表的数据库名,所以会导入到默认的default数据库下。
sqoop import \
--connect jdbc:mysql://192.168.10.203:3306/test?tinyInt1isBit=false\&zeroDateTimeBehavior=convertToNull\&dontTrackOpenResources=true\&defaultFetchSize=1000\&useCursorFetch=true \
--driver com.mysql.jdbc.Driver \
--username root \
--password-file /user/kms/sqoop.pwd \
--table employee \
--hive-import \
--hive-overwrite \
--hive-table employee \
--fields-terminated-by "\t" \
--null-string '\\N' \
--null-non-string '\\N'
2.Sqoop是如何将表导入Hive的
sqoop会先将表导入到HDFS,默认情况下(即不指定导入的路径地址),会在当前用户的目录下生成与表名相同的文件夹,比如当前用户为kms,导入的表为employee,则会先将导入的文件放在HDFS的/user/kms/employee路径下,导入过程中在该路径下生成_temporary文件,完成之后会生成完整的小文件。最后会把这些文件放在hive表的存储路径下,默认会在hdfs://kms-1.apache.com:8020/user/hive/warehouse/employee下