- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 hadoop伪分布式安装(Linux)
基础设施确保网络没问题ping www.baidu.com设置网络设置IP设置主机名设置本机的ip到主机名的映射关系关闭防火墙关闭 selinux做时间同步安装JDKssh免密
2020-07-01 11:49:24 153
原创 hdfs相关问题
1.我有一万个元素(比如数字或单词)需要存储?如果查找某一个元素,最简单的遍历方式复杂的是多少?如果我期望复杂度是O(4)呢?2.有一个非常大的文本文件,里面有很多很多的行,只有两行一样,它们出现在未知的位置,需要查找到它们。3.2000台真的比一台速度快吗?如果考虑分发上传文件的时间呢?如果考虑每天都有1T数据的产生呢?如果增量了一年,最后一天计算数据呢?4.分布式文件系统那么多,为什么hadoop项目中还要开发一个hdfs文件系统?5.hdfs的存储模型。6.hdfs的架构设计。7
2020-06-29 11:26:42 196
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人