1. Sqoop安装在hadoop.client上
2. 复制一份sqoop-env-template.sh,命名为sqoop-env.sh
3. 修改sqoop-env.sh的内容:
export HADOOP_COMMON_HOME=/home/hadoopuser/hadoop
export HADOOP_MAPRED_HOME=/home/hadoopuser/hadoop/lib
export HIVE_HOME=/home/hadoopuser/hive
4. 复制一份sqoop-site-template.xml,命名为sqoop-site.xml
5. 如果没有使用HBASE数据库,则需要修改bin/configure-sqoop文件,将其中有关hbase的内容全部使用#号注销掉
6. 需要连接sqlserver数据库,则需要下载sqljdbc.jar和sqljdbc4.jar,并将这两个文件拷贝到sqoop/lib文件夹下
下载地址: http://www.microsoft.com/en-us/download/details.aspx?displaylang=en&id=21599
下载tar.gz的安装包
7. 常用命令:
(1) 导入
a. 依据导入表创建hive表
Bin/sqoop create-hive-table --connect ‘jdbc:sqlserver://ip;username=用户名;password=密码;database=数据库名’ --table 表名 --hive-table hive的表名
b. 导入数据并关联至hive表
Bin/sqoop import --connect ‘jdbc:sqlserver://ip;username=用户名;password=密码;database=数据库名’ --table 表名 --hive-import --hive-table hive的表名
(2) 导出
Bin/sqoop export --connect ‘jdbc:sqlserver://ip;username=用户名;password=密码;database=数据库名’ --table 表名 --export-dir /user/hive/warehouse/表名 --input-fields-terminated-by '\001'