- 博客(3)
- 收藏
- 关注
原创 Hive优化
1.map side join:将小表进行缓存,这样子就可以有效的减少MapReduce的数量从而提高计算效率。要求小表需要放在join的左 侧。默认缓存的内存大小是25M2.多表join与where同时出现当进行多表的join操作的时候,如果出现了where查询,那么需要先利用子查询进行条件查询然后再进行join,这么做的目的是为了减少中间产生的数据量和计算量3.group by**...
2019-08-18 11:51:41
86
原创 Hadoop版本
Hadoop1.0:HDFS和MapReduce 1.2为官方稳定版本Hadoop2.0:HDFS、MapReduce以及Yarn。在Hadoop2.7中,出现了Ozone。和Hadoop1.0版本完全不兼容 2.7为官方稳定版本Hadoop3.0:HDFS、MapReduce、Yarn以及Ozone。在Hadoop3.0的最新版本中才包含Submarine。在2017.12公布...
2019-08-18 11:35:01
153
转载 linux常用指令
1、ls命令就是list的缩写,通过ls 命令不仅可以查看linux文件夹包含的文件,而且可以查看文件权限(包括目录、文件夹、文件权限)查看目录信息等等 常用参数搭配: ls -a 列出目录所有文件,包含以.开始的隐藏文件 ls -A 列出除.及..的其它文件 ls -r 反序排列 ls -t 以文件修改时间排序 ls -S...
2019-08-18 11:22:07
93
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人