- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 hadoop伪分布式安装(Linux)
基础设施 确保网络没问题 ping www.baidu.com 设置网络 设置IP 设置主机名 设置本机的ip到主机名的映射关系 关闭防火墙 关闭 selinux 做时间同步 安装JDK ssh免密
2020-07-01 11:49:24 146
原创 hdfs相关问题
1.我有一万个元素(比如数字或单词)需要存储? 如果查找某一个元素,最简单的遍历方式复杂的是多少? 如果我期望复杂度是O(4)呢? 2.有一个非常大的文本文件,里面有很多很多的行,只有两行一样,它们出现在未知的位置,需要查找到它们。 3.2000台真的比一台速度快吗? 如果考虑分发上传文件的时间呢? 如果考虑每天都有1T数据的产生呢? 如果增量了一年,最后一天计算数据呢? 4.分布式文件系统那么多,为什么hadoop项目中还要开发一个hdfs文件系统? 5.hdfs的存储模型。 6.hdfs的架构设计。 7
2020-06-29 11:26:42 190
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人