MAPREDUCE-WORLD COUNT
mapreduce-并行处理大数据集的框架
处理机制:JOBTRACKER-TASKTRACKER-JOB-MAP-REDUCE-OUTPUT
主要思想:分而制之
#查看JAR信息
hadoop jar hadoop-mapreduce-examples-2.7.1.jar
#在HDFS新建目录 此目录虚拟?
hadoop fs -mkdir /input
#将服务器的文件拷贝到HDFS目录下
hadoop fs -put input/test.txt /input
#执行WORLDCOUNT /output表示使用 HDFS 根目录下的 output 目录存储程序的输出,文件会自动生成
hadoop jar hadoop-mapreduce-examples-2.7.1.jar wordcount /input /output
#查看生成内容
hadoop fs -cat /output
HIVE SQOOP MYSQL 数据同步
---
--- , ,
配置HIVE
http://blog.csdn.net/sl1992/article/details/53589349
HIVE常用语法
http://blog.csdn.net/wisgood/article/details/17186599
配置SQOOP
http://blog.csdn.net/scgh_fx/article/details/73522372
利用SQOOP导入mysql数据
sqoop list-databases -connect jdbc:mysql:
- -- -- -- -- --- --- --- ---- --- - ----