下载地址
http://mirror.bit.edu.cn/apache/sqoop/
因为官方并不建议在生产环境中使用sqoop2,即1.99.7,所以这里我用的是sqoop1,即1.4.7
找个编译好的,懒得去自己编译。
sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz
重命名,我都爱留着版本号。sqoop-1.4.7
配置环境变量;根据自己的系统看看如何配置;我的是mac;如下
vi ~/.bash_profile
加入下面
export SQOOP_HOME=/Users/你的用户名/sqoop-1.4.7
export PATH=$PATH:$SQOOP_HOME/bin
别忘记了 source ~/.bash_profile
接着去修改配置文件
将 sqoop-env-template.sh 重命名成 sqoop-env.sh
编辑
配置你的hadoop和hive安装路径;
找个mysql连接包。放到sqoop的lib目录下
配置完,测试导入。
从mysql导出表到hive数据仓库
mysql里建个库和表。用自己以前有的库表也行。测试而已。
这里有些做好的表。就来当测试用了。
CREATE TABLE `user_account` (
`ac_no` int(11) NOT NULL DEFAULT '0',
`user_id` varchar(30) DEFAULT NULL,
`user_pswd` varchar(30) DEFAULT NULL,
`date` datetime DEFAULT NULL,
`no_of_visit` int(11) DEFAULT NULL,
`no_of_trnsc` int(11) DEFAULT NULL,<