![](https://img-blog.csdnimg.cn/20190918140158853.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
福大大之大数据
大数据相关
福大大笔记
这个作者很懒,什么都没留下…
展开
-
hdfs api实操
原创 2020-07-02 11:48:01 · 80 阅读 · 0 评论 -
hadoop伪分布式安装(Linux)
基础设施确保网络没问题ping www.baidu.com设置网络设置IP设置主机名设置本机的ip到主机名的映射关系关闭防火墙关闭 selinux做时间同步安装JDKssh免密原创 2020-07-01 11:49:24 · 153 阅读 · 0 评论 -
hdfs相关问题
1.我有一万个元素(比如数字或单词)需要存储?如果查找某一个元素,最简单的遍历方式复杂的是多少?如果我期望复杂度是O(4)呢?2.有一个非常大的文本文件,里面有很多很多的行,只有两行一样,它们出现在未知的位置,需要查找到它们。3.2000台真的比一台速度快吗?如果考虑分发上传文件的时间呢?如果考虑每天都有1T数据的产生呢?如果增量了一年,最后一天计算数据呢?4.分布式文件系统那么多,为什么hadoop项目中还要开发一个hdfs文件系统?5.hdfs的存储模型。6.hdfs的架构设计。7原创 2020-06-29 11:26:42 · 201 阅读 · 0 评论