先自我介绍一下,小编浙江大学毕业,去过华为、字节跳动等大厂,目前阿里P7
深知大多数程序员,想要提升技能,往往是自己摸索成长,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年最新大数据全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!
由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新
如果你需要这些资料,可以添加V获取:vip204888 (备注大数据)
正文
![](https://img-blog.csdnimg.cn/img_convert/fa90a410daba9db072a517bf263440f2.png)
(4)给Spark文件重命名为spark-2.2.0
mv spark-2.2.0-bin-hadoop2.7 spark-2.2.0
(5)配置环境变量,编辑 /etc/profile 文件,在文件最后添加 spark 路径
vim /etc/profile
![](https://img-blog.csdnimg.cn/img_convert/6098dba747476e1cf66bbe5b5bdd97a9.png)
export SPARK_HOME=/opt/spark-2.2.0
export PATH=
S
P
A
R
K
H
O
M
E
/
b
i
n
:
SPARK_HOME/bin:
SPARKHOME/bin:SPARK_HOME/sbin:$PATH
![](https://img-blog.csdnimg.cn/img_convert/6176542812647df452f0967034889b58.png)
(6)使环境变量生效
source /etc/profile
![](https://img-blog.csdnimg.cn/img_convert/04237c6a2d9e4f4d4bdba2eca10c608c.png)
(7)切换到 /opt/spark-2.2.0/conf 目录下
cd /opt/spark-2.2.0/conf
![](https://img-blog.csdnimg.cn/img_convert/85175c6d010d3de776fd6450210808bf.png)
(8)修改 spark 的配置文件 spark-env.sh
先将文件 spark-env.sh.template 重命名为 spark-env.sh
mv spark-env.sh.template spark-env.sh
![](https://img-blog.csdnimg.cn/img_convert/f4834acd9f669e38a9ef4e6cecaf0047.png)
再修改文件spark-env.sh
vim spark-env.sh
![](https://img-blog.csdnimg.cn/img_convert/e76fca03d34227d0fc3db311303e0b7a.png)
修改内容如下:
JAVA_HOME=/opt/jdk1.8.0_111
SPARK_MASTER_HOST=master
#默认端口就是7077, 可以不配置此项
SPARK_MASTER_PORT=7077
YARN_CONF_DIR=/opt/hadoop-2.7.6/etc/hadoop
![](https://img-blog.csdnimg.cn/img_convert/f79ed080f389eccab695b89d84583508.png)
(9)修改spark的配置文件
①、先将文件slaves.template重命名为slaves
mv slaves.template slaves
②、再修改文件slaves
vim slaves
修改内容如下:
master
slave1
slave2
(10)由于slave1节点也需要安装 spark,因此可以先将master节点的 /opt/spark-2.2.0 文件和 /etc/profile 文件拷贝到slave1的相同路径下
scp -r /opt/spark-2.2.0 root@slave1:/opt
![](https://img-blog.csdnimg.cn/img_convert/f7f722527c7b4a2af9a5e623ca8c0080.png)
scp /etc/profile root@slave1:/etc
![](https://img-blog.csdnimg.cn/img_convert/065ec70bafd8483bb2a7af16b7289324.png)
(11)由于slave2节点也需要安装 spark,因此可以先将master节点的 /opt/spark-2.2.0 文件和 /etc/profile 文件拷贝到slave2的相同路径下
scp -r /opt/spark-2.2.0 root@slave2:/opt
![](https://img-blog.csdnimg.cn/img_convert/a6e3076b01fefdf80e8411a2e8bb793b.png)
scp /etc/profile root@slave2:/etc
![](https://img-blog.csdnimg.cn/img_convert/b1769f90723f2fcbedd948997373d9f4.png)
(12)使用 Yarn 模式运行计算 PI 的程序
①、切换到/opt/spark-2.2.0目录下
cd /opt/spark-2.2.0
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
需要这份系统化的资料的朋友,可以添加V获取:vip204888 (备注大数据)
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
究,那么很难做到真正的技术提升。**
需要这份系统化的资料的朋友,可以添加V获取:vip204888 (备注大数据)
[外链图片转存中…(img-An1f8sFi-1713411694466)]
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!