Hadoop配置启动

最新推荐文章于 2024-08-20 17:13:44 发布

叹君心

最新推荐文章于 2024-08-20 17:13:44 发布

阅读量750

点赞数

分类专栏：分布式 Hadoop 文章标签： Hadoop 分布式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jingmiaowill/article/details/9361307

版权

分布式同时被 2 个专栏收录

6 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

其实这不是首次触电hadoop,早在大学毕设中就已经采用hadoop开发了，当时开发的是一个hadoop为基础的搜索引擎，包括爬虫，倒排索引、查询都基于hadoop的分布式平台实现。但是当时还不懂什么叫集群，更不要说分布式了。现在工作已经一年了，对集群开发，分布式，大数据等知识都有了一定的理解和认识，所以现在准备重新拿起hadoop的书，进行一下二次学习，从中学习一些更深的知识，希望以后可以从事hadoop的开发甚至可以采用hadoop进行二次开发，下面先对基本的配置运行进行一下最基础的总结。

一、配置文件

首先要先编辑hadoop启动的配置文件

1.编辑conf/hadoop-env.sh

设置java路径，还可以配置python等语言;

2.编辑conf目录下得core-site.xml hdfs-site.xml mapred-site.xml

a.core-site.xml

指定namenode的ip地址和端口;

投入使用后localhost要是真实地址;

b.hdfs-site.xml

dfs.data.dir是数据存储的地方，要事先创建好；

dfs.replication控制最多备份多少份；

c.mapred-site.xml

设置他的job管理；

配置ssh,生成秘钥,使到可以免秘钥登陆

ssh-keygen -t rsa
cp id_dsa.pub authorized_keys

记得开启mac的远程登录

格式化HDFS

启动服务

jps查看启动的所有java进程包括如下:

停止服务

到这里hadoop的基本配置就完成了，由于机器数量限制所以只是采用了单台的伪分布式模式。以后还会对其他hadoop的知识进行总结。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hadoop配置启动

其实这不是首次触电hadoop,早在大学毕设中就已经采用hadoop开发了，当时开发的是一个hadoop为基础的搜索引擎，包括爬虫，倒排索引、查询都基于hadoop的分布式平台实现。但是当时还不懂什么叫集群，更不要说分布式了。现在工作已经一年了，对集群开发，分布式，大数据等知识都有了一定的理解和认识，所以现在准备重新拿起hadoop的书，进行一下二次学习，从中学习一些更深的知识，希望以后可以从事h
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。