参考:
http://f.dataguru.cn/thread-54454-1-1.html
http://archive.cloudera.com/cdh/3/sqoop-1.2.0-CDH3B4/SqoopUserGuide.html
虚拟机环境:
redhat 5
软件版本:
下面是CDH3和SQOOP 1.2.0的下载地址
http://archive.cloudera.com/cdh/3/hadoop-0.20.2-CDH3B4.tar.gz
http://archive.cloudera.com/cdh/3/sqoop-1.2.0-CDH3B4.tar.gz
复制JAR
[hadoop@hadooporacle hadoop]$ cp hadoop-0.20.2-CDH3B4/hadoop-core-0.20.2-CDH3B4.jar sqoop-1.2.0-CDH3B4/lib/
[hadoop@hadooporacle hadoop]$ cp /home/ojdbc6_g.jar sqoop-1.2.0-CDH3B4/lib/
修改SQOOP的文件configure-sqoop
由于Shell不支持直接多行注释,最常用的两个方法是:
注意
1)
<< EOF
中间是要注释的语句块
EOF
2)
使用逻辑判断
if [ ]; then
fi
注意[]中间要有个空格。
还有其他HBASE和ZOOKEEPER的部分也需要注释掉。
一共很好几个地方
启动hadoop
注意目录
4.常用的sqoop命令:
1)连接oracle并列出数据库中的表
sqoop list-tables --connect jdbc:oracle:thin:@192.168.80.60:1521:hadoop --username scott --password=oracle
3)从Oracle导入数据到hive
sqoop import --hive-import --connect jdbc:oracle:thin:@192.168.80.60:1521:hadoop --username scott --password=oracle --verbose -m 1 --table emp
原因是没有用
原因是:表名在大写
sqoop import --hive-import --connect jdbc:oracle:thin:@192.168.80.60:1521:hadoop --username scott --password=oracle --verbose -m 1 --table EMP
测试