Sqoop导入数据到Hive上
flume收集日志:主动的和被动的
看文档
sqoop底层是MR,要运行sqoop要有yarn环境,做大数据平台和关系型数据库导入导出工具,必须要有连接数据库的驱动
1、node1节点上已经安装了mysql,并允许远程连接:
[root@node1 ~]# service mysql start
[root@node1 ~]# service mysql status
2、将数据导入到HDFS中去
2.1、解压sqoop压缩文件到Linux主机上的指定目录
[root@node1 software]# tar -zxf sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz -C /opt/modules
[root@node1 software]# cd /opt/modules
[root@node1 modules]# mv sqoop-1.4.6.bin__hadoop-2.0.4-alpha sqoop-1.4.6