
spark
saprk开发、优化
赶路人儿
一个十年以上编程人员,擅长使用java、python、C++等语言,具有广告投放、个性化推荐引擎等超大规模系统开发经验。
展开
-
配置Hadoop集群远程客户端
在Hadoop和Spark集群搭建好了以后,如果我们需要向集群中发送、获取文件,或者是执行MapReduce、Spark作业,通常是搭建一个外围的、集群的客户端,在这个客户端上进行操作。而不是直接在集群的NameNode或者DataNode上进行。此时,集群和客户端的结构如下图所示(简化图,没有考虑NameNode的高可用),本文将介绍如何快速搭建一个集群客户端(有时也叫gateway)。 说明:在网络配置方面,可以遵循集群仅开放内网访问,而客户端开放外网访问,所有对集群的访问和管理,均通过客户端来完原创 2022-05-30 10:45:54 · 1677 阅读 · 0 评论 -
iead开发scala程序、spark程序
首先,谈一下建立scala工程的问题,有两种方法 file–new project–maven-apache scala file–new project–scala–maven/stb 无法建立scala文件通常有以下几个原因 建立的工程不是scala工程 没有下载scala插件,scala的下载方法为file–setting–plugins搜索scala,然后install 添加module dependencies既要有JDK还要有scala jdk ...原创 2022-03-11 14:56:05 · 1878 阅读 · 0 评论