- 博客(1)
- 资源 (9)
- 收藏
- 关注
转载 如何从根源上解决 HDFS 小文件问题
原文地址:https://www.iteblog.com/archives/2320.html 我们知道,HDFS 被设计成存储大规模的数据集,我们可以在 HDFS 上存储 TB 甚至 PB 级别的海量数据。而这些数据的元数据(比如文件由哪些块组成、这些块分别存储在哪些节点上)全部都是由 NameNode 节点维护,为了达到高效的访问, NameNode 在启动的时候会将这些元数据全部加载到内存...
2018-10-16 10:43:28 3241
Hive、Hbase、Mahout
内含mahout实践指南,hive编程指南,hbase权威指南,hbase实战,hbase企业应用实战,mahout实战等等7本书,你值得拥有
2018-05-24
机器学习与数据挖掘
内含推荐系统实战,机器学习实战,机器学习算法原理与编程实践,机器学习:实用案例解析,机器学习导论,数据挖掘:概念与技术,数据挖掘十大算法等等8本书,你值得拥有
2018-05-24
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人