大数据面试题 (附答案) Hive 与传统数据库的区别 查询语言HQL SQL数据存储位置 HDFS Raw Device或者 Local FS数据格式 用户定义 系统决定数据更新不支持支持索引无有 执行MapRedcueExecutor执行延迟高低可扩展性高低数据规模大小Hadoop的流程 1.创建hadoop用户 2.修改IP 3.安装JDK,并配置环境变量 4.修改ho...
hadoop 面试题分享 部分有答案(自己总结的) hadoop 面试题分享 部分有答案(自己总结的)MapReduce的原理 (1)MapReduce 是一种分布式计算框架,由 Google 提出,主要用于搜索领域,以解决海量数据的计算问题。(分布式存储和分布式计算发轫于 Google 这样的公司是不足为奇的)(2)MapReduce 由两个阶段组成:Map (开始)和 Reduce(结束),用户只需实现 map() 和 reduce(...