hadoop实战之目录规划

最新推荐文章于 2023-05-08 10:30:00 发布

cariya123

最新推荐文章于 2023-05-08 10:30:00 发布

阅读量317

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xbyang18/article/details/80806875

版权

实战大数据的第一件事，那就是安装软件，安装hadoop了，

下面就是在安装前要对目录进行规划：

安装目录

数据存储目录

中间结果目录

pid目录

其他目录

安装目录

一般我们安装hadoop或者别的软件，框架本身占不了多大空间，所以一般安装在好一些的SAS硬盘就可，普通情况下，我们安装的目录通常是~/app/下面

数据存储目录

一般数据存储目录，因为要存储大量的数据，所以需求的磁盘空间比较大，所以我们不会把数据存储目录与软件的安装目录，比如不会和hadoop的安装目录放在一起，而是通常挂多个大的硬盘在上面，这样就会在多个硬盘上新建几个目录，比如d1,d2...

这样我们在读写时就会压力均衡

中间结果目录

这个因为要存储数据，与数据存储目录要求一样

pid目录

通常当我们在启动hadoop后，会有NameNode,DataNode等java进程启动，那么进程号就是pid，这个pid不是每次去生成，而是第一次生成后会保存在一个目录文件里，当我们jps或者ps -ef时，是从这个目录文件里读取出来的，如果我们不配置，那么默认就会在/tmp下新建了，这样在/tmp目录是规范的

其他目录

其实用到的一些目录

所以目录规划是很重要的，在生产上我们一定是提前规划好的

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hadoop实战之目录规划

实战大数据的第一件事，那就是安装软件，安装hadoop了，下面就是在安装前要对目录进行规划：安装目录数据存储目录中间结果目录pid目录其他目录
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。