- 博客(3)
- 收藏
- 关注
转载 HIVE学习笔记
HIVE的架构图: 三大组成部分: 用户接口:包括 CLI,JDBC/ODBC,WebUI 元数据存储(metastore):默认存储在自带的数据库derby中,线上使用时一般换为MySQL Driver:解释器、编译器(compiler)、优化器(Optimizer)、执行器(executor)
2017-08-17 20:57:05 160
转载 mapreduce笔记
一、 inputSplit InputSplit是指分片,在MapReduce当中作业中,作为map task最小输入单位。分片是基于文件基础上出来的而来的概念,通俗的理解一个文件可以切分为多少个片段,每个片段包括了等信息。在MapTask拿到这些分片后,会知道从哪开始读取数据。二、处理阶段input->map->partitions->sort->combine(到这里是
2017-08-15 20:13:25 256
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人