Ambari 操作指南,熟悉Ambari 的基本操作,该系列总共有6篇文章,第一篇是基础,另外五篇是拓展延伸,你们可以先看第一篇,了解Ambari 界面上的操作和功能
https://blog.csdn.net/devalone/article/details/80781652
Hadoop系列介绍:含HDFS、MapReduce、Hive、HBase等基本组件的介绍
https://www.cnblogs.com/sunddenly/category/611923.html
任务hdfs增删改查:含Hdfs针对文件的基本操作,类似于Linux的操作
https://www.cnblogs.com/sunddenly/p/3981583.html
任务hive脚本的启动,创建表,和执行sql语句:该部分设计SQL语言(学习网站https://www.w3school.com.cn/sql/sql_create_table.asp),然后Hive的概念、机制和基础命令可以参考以下链接
https://blog.csdn.net/a2011480169/article/details/51482799
任务spark-submit提交任务:
https://blog.csdn.net/hellozhxy/article/details/80483376
Yarn知识:https://www.cnblogs.com/linbingdong/p/6287287.html
Spark知识:https://www.cnblogs.com/qingyunzong/p/8886338.html
Spark中的DataFrame操作:将用于完成鸢尾花数据的数据探索和统计https://www.cnblogs.com/honey01/p/8065232.html
Iris.data分类:
(1)支持向量机SVM分类器:http://dblab.xmu.edu.cn/blog/1268/
(2)逻辑斯蒂回归分类器:http://dblab.xmu.edu.cn/blog/1279/
ORC格式和数据探索:
https://orc.apache.org/
https://blog.csdn.net/sinat_26917383/article/details/80500349
https://blog.csdn.net/bitcarmanlee/article/details/52006338