- 博客(2)
- 收藏
- 关注
原创 hadoop-2.6.0-cdh5.14.0重新编译
hadoop-2.6.0-cdh5.14.0重新编译1、为什么重新编译首先解释为什么要用CDH版本 现在Apache对hadoop的更新迭代很快,但对生态圈中其他框架并不一定兼容,学习试验还是可以用的,但是在实际生产环境没法用。 所以:我们使用CDH版本 CDH是美国一家大数据公司cloudera在apache开源hadoop的版本上,通过自己公司内部的各种补丁,实现版本之间的稳...
2018-08-29 22:58:18 1686 1
原创 大数据基础内容介绍(初步了解大数据hadoop)
大数据基础内容介绍(初步了解大数据hadoop)hadoop的介绍以及发展历史Hadoop**最早起源于Nutch**。Nutch的设计目标是构建一个大型的全网搜索引擎,包括网页抓取、索引、查询等功能,但随着抓取网页数量的增加,遇到了严重的可扩展性问题——如何解决数十亿网页的存储和索引问题。2003年、2004年谷歌发表的两篇论文为该问题提供了可行的解决方案。 ——分布式文件系统(G...
2018-08-26 22:30:31 514
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人