1、怎么使用Hadoop
Hadoop集群的搭建
无论是在windows上装几台虚拟机玩Hadoop,还是真实的服务器来玩,说简单点就是把Hadoop的安装包放在每一台服务器上,改改配置,启动就完成了Hadoop集群的搭建。
上传文件到Hadoop集群
Hadoop集群搭建好以后,可以通过web页面查看集群的情况,还可以通过Hadoop命令来上传文件到hdfs集群,通过Hadoop命令在hdfs集群上建立目录,通过Hadoop命令删除集群上的文件等等。
编写map/reduce程序
通过集成开发工具(例如eclipse)导入Hadoop相关的jar包,编写map/reduce程序,将程序打成jar包扔在集群上执行,运行后出计算结果。
2、hadoop的三大核心组件之HDFS和YARN
3、Flume
4、sqoop
5、map/reduce程序
6、Eclipse
7、Hbase
8、Hive
(数据仓库,可以用来创建多维立方体)
9、可视化 ES+Kibana
10、 机器学习
11、R语言和大数据的结合
- 如何让Hadoop结合R语言做大数据分析 https://zhidao.baidu.com/question/810295737780436932.html?qbl=relate_question_5&word=R%D3%EF%D1%D4%D4%F5%C3%B4%BD%E1%BA%CF%B4%F3%CA%FD%BE%DD%BB%FA%C6%F7%D1%A7%CF%B0%BF%F2%BC%DC