- 博客(4)
- 收藏
- 关注
原创 Spark API
Spark API主要有两个抽象部件组成:Spark Context和RDD,应用程序通过这两个部件和Spark进行交互,连接到Spark集群并使用相关资源。 1.Spark Context 是定义在Spark库中的一个类,作为Spark库的入口,包含应用程序 main( ) 方法的Driver program通过Spark Context对象访问Spark,因为Spark Context对象表示...
2019-11-18 01:00:06 379
原创 Spark工作原理
面试: 掌握Java开发 熟悉HDFS/HBase/Hive/MapReduce/spark,有丰富的分布式编程经验; 熟悉Spark Streaming和Spark SQL; 熟悉Core Java,熟悉Java IO, NIO, 多线程编程, 熟悉JVM运行机制和内存管理,网络协议; 熟练掌握Linux操作系统,熟悉shell等脚本编程; 有在Spark相关项目中应用Java或Python语言...
2019-11-18 00:41:38 244
原创 数据湖
什么是数据湖? 数据湖是一个集中式存储库,允许您以任意存储规模存储所有结构化或非结构化数据。您可以按原样存储数据(无需先对数据进行结构化处理),并运行不同类型的分析 - 从控制面板和可视化到大数据处理,实时分析和机器学习,以指导做出更好的决策 。 用来将企业中现有的数据进行有效的整合,快速准确的提供报表并提出决策依据,帮助企业做出明智的业务经营决策。 EDL,企业级数据湖(原始数据的保存区)。 ...
2019-11-12 01:41:25 312
原创 Bootstrap
Bootstrap 概念: Bootstrap是Twitter退出的一个用前端开发发的开源框架,是一个做网页的框架(目前最流行的web前端框架),就是说你只需要写HTML标签就可以调用它的类,就可以快速的做一个高大上的网页(非常漂亮的样式网页)。 使用: bootstrap对css样式进行了简单的封装,通过class呈现给开发者使用,是开发更为便捷,但是仍需要了解class如何被实现。 容器: ...
2019-11-01 11:51:56 225
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人