简答题
大数据各个组件的简答题,你值得拥有!
大数据梦想家
专注与研究大数据基础,理论,架构与原型实现。
个人原创公众号「 大数据梦想家 」,每日更新大数据干货,欢迎上车!
一天的生活就是一生的缩影。在最美的年华,做最好的自己!!!
展开
-
HBase简答题(持续更新)
1.HBase的基本介绍a.Hbase是建立在hdfs之上的一个数据库,b.不支持join等SQL复杂操作c.支持的数据类型:byte[],d.依靠横向扩展,一个表可以有上十亿行,上百万列。e.面向列(族)的存储和权限控制f.对于为空(null)的列,并不占用存储空间,是一个稀疏表。2.HBASE的适用场景海量数据、精确查询、快速返回海量数据:指的是数据量的背景精确查询:业务场...原创 2019-12-16 18:15:51 · 5371 阅读 · 0 评论 -
Hive经典简答题
什么是Hive?Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能(HQL)。2.HIve的意义(最初研发的原因)减少开发人员的开发成本和学习成本。3.Hive的内部组成模块,作用分别是什么元数据:描述数据的数据内部执行流程:解析器(解析SQL语句)、编译器(把SQL语句编译成MapReduce程序)、优化器(优化...原创 2019-11-30 00:13:18 · 5628 阅读 · 0 评论 -
MapReduce经典简答题
在上一个阶段——HDFS,小菌出过一期HDFS的经典面试题,不知道小伙伴们掌握的怎么样吖(详情见–>《HDFS经典面试题》),本期同样在MapReduce快要结束阶段为大家带来MapResuce的经典面试题!MapReduce核心思想map负责切分,reduce负责合并(先分后合,分而治之)...原创 2019-11-16 14:42:45 · 4849 阅读 · 0 评论 -
HDFS经典简答题(实习生必看!)
前一段时间,小菌陆续分享了HDFS系列1-12的博客,总算是要完结了。于是小菌打算再出一期关于HDFS的经典面试题,其中的内容大多都出自于在前面分享的博客中,感兴趣的小伙伴们可以自行浏览,链接小菌放到文末了哦~1.怎么理解分布式? 分布式需要从计算和存储两个方面来讨论:分布式计算:是一种计算方法,是将该应用分解成许多小的部分,分配给多台计算机进行处理。这样可以节约整体计算时间,大大提...原创 2019-11-09 11:00:40 · 4595 阅读 · 9 评论