![](https://img-blog.csdnimg.cn/20201209212628659.jpg?x-oss-process=image/resize,m_fixed,h_224,w_224)
Hadoop2.7.2
1、全程案例贯穿始终,几乎每个知识点都有配套的案例;
2、整个框架深入源码讲解;
3、优化措施全部来源于企业开发;
4、Hadoop相关企业真题全覆盖
俺是刘铁柱
这个作者很懒,什么都没留下…
展开
-
13_hadoop的优势(4高)
1、hadoop的优势(4高)1)高可靠性:Hadoop底层维护多个数据副本,所以即使Hadoop某个计算元素或存储出现故障,也不会导致数据的丢失。2)高扩展性:在集群间分配任务数据,可方便的扩展数以千计的节点。3)高效性:在MapReduce的思想下,Hadoop是并行工作的,以加快任务处理速度。4)高容错性:能够自动将失败的任务重新分配。...原创 2020-12-09 22:02:34 · 724 阅读 · 0 评论 -
12_hadoop三大发行版本
1、hadoop三大发行版本Hadoop三大发行版本:Apache、Cloudera、Hortonworks。Apache版本最原始(最基础)的版本,对于入门学习最好。Cloudera在大型互联网企业中用的较多。Hortonworks文档较好。Apache Hadoop官网地址:http://hadoop.apache.org/releases.html下载地址:https://archive.apache.org/dist/hadoop/common/Cloudera Hadoop官网原创 2020-12-09 22:02:06 · 335 阅读 · 0 评论 -
11_hadoop发展历史
1、hadoop发展历史1)Lucene框架是Doug Cutting开创的开源软件,用Java书写代码,实现与Google类似的全文搜索功能,它提供了全文检索引擎的架构,包括完整的查询引擎和索引引擎。2)2001年年底Lucene成为Apache基金会的一个子项目。3)对于海量数据的场景,Lucene面对与Google同样的困难,存储数据困难,检索速度慢。4)学习和模仿Google解决这些问题的办法 :微型版Nutch。5)可以说Google是Hadoop的思想之源(Google在大数据方面的三原创 2020-12-09 22:03:21 · 345 阅读 · 0 评论 -
04_大数据概念
1、大数据概念大数据(big data),IT行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》 [1] 中大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Verac原创 2020-12-09 22:00:45 · 185 阅读 · 0 评论