理解Automatically selecting local only mode for query本地模式

最新推荐文章于 2022-07-07 11:24:50 发布

oliang

最新推荐文章于 2022-07-07 11:24:50 发布

阅读量977

点赞数

文章标签： hive 启动本地模式参数配置 local only mode for

本文链接：https://blog.csdn.net/oliang/article/details/47974361

版权

对 hive有些了解的人都会知道，hive 会将 SQL 语句最终转化成分布式执行的 mapreduce 任务计划。对于大数量集的数据启动 mapreduce 所花费的时间是渺小的

因为数据量大，并且分布再不同的机器上，在不同的机器上处理，这样做是 hive 的优势之一。然而当处理小数量，并且数据都聚集再一台机器上时，那么启动本地模式是非常有意的，不可避免的启动 mapreduce，将数据拉回客户端，本地处理，这样减少了分处理后合并花费的时间。

启动本地模式，需要配置如下参数：

hive.exec.mode.local.auto 决定 Hive 是否应该自动地根据输入文件大小，在本地运行。

hive.exec.mode.local.auto.inputbytes.max 最大输入数据量,当输入数据量小于这个值的时候将会启动本地模式,默认是 128M。

hive.exec.mode.local.auto.tasks.max 最大输入文件个数,当输入文件个数小于这个值的时候将会启动本地模式。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

oliang

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Chrome的启动参数

Criss@陈磊

02-23

4727

List of Chromium Command Line Switches Condition Explanation --[1]⊗ Classic, non-material, mode for the |kTopChromeMD| switch.↪ --0⊗ Value of the --profiler-timing flag that will disable timin...

UG\NX二次开发多少词汇量才能无障碍阅读开发帮助

王牌飞行员_里海的博客

04-24

2119

大家都知道UFUN的帮助是英文的，有的开发者抱怨看不懂，还有的开发者为了能看懂接口说明专门学英语，那么英语学成什么程度就能无障碍阅读接口文档？我比较好奇，所以专门将UF_MODL部分的ufun函数的接口说明，提取出单词以作统计。大家猜一猜无障碍阅读UF_MODL部分的内容，需要多少词汇量储备呢？

参与评论您还未登录，请先登录后发表或查看评论

下拉框的queryMode相当重要

etufo1的专栏

08-20

2434

在做一个下拉框的联动的时候，遇到了一个

Hive中运行任务报错：Error during job, obtaining debugging information...

weixin_45793065的博客

05-29

4856

错误 Ended Job = job_1545829388777_0070 with errors Error during job, obtaining debugging information... FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask MapReduce Jobs Launched: Stage-Stage-1: HDFS Read: 0 HDFS Writ

【Hive六】Hive调优小结

weixin_33695450的博客

05-31

248

Hive调优 Hive调优 Fetch抓取本地模式表的优化小表、大表Join 大表Join大表 MapJoin Group By Count(Distinct) 去重统计行列过滤动态分区调整案例实操数据倾斜 Map数小文件进行合并复杂文件增加Map数 Reduce数并行执行严格模式 JVM重用推测执行执行计划（Explain） Fetch抓取 Fet...

Hive性能调优之Fetch抓取

寒暄的博客

07-10

1318

Fetch抓取是指hive在某些情况的查询可以不必使用MapReduce计算，例如在执行一个简单的select * from XX 时，我们只需要简单的进行抓取对应目录下的数据即可。在hive-default.xml.template中，hive.fetch.task.conversion默认是morn，老版本中默认是minimal。该属性为morn时，在全局查找，字段查找，limit查找等都不走MapReduce。 <property> <name>hive.fetch

解决：WARNING: Hive-on-MR is deprecated in Hive 2 and may not be available in the future versions.

lanachen的博客

07-07

1万+

WARNING: Hive-on-MR is deprecated in Hive 2 and may not be available in the future versions. Consider using a different execution engine (i.e. spark, tez) or using Hive 1.X releases.

Hive的基本操作2

lvqianqian_csdn的博客

03-03

858

3.1.6 Hive事务操作 Hive开始支持事务，是在Hive0.14之后。HDFS的文件，只能允许新建，删除，对文件中的内容进行更新，不允许单条修改。Hive的文件存储是基于HDFS文件存在的，所以原则上不会直接对HDFS做文件内容的事务更新，只能是采取另外的手段来完成。即用HDFS文件作为原始数据，用delta文件作为操作日志的记录。当访问Hive数据时，根据HDFS文件和delta文件做...

使用Intel NCS算力棒安装部署记录 VirtualBox With Ubuntu16.04 Source Aliyun

夜澜偶作庄周梦酒后聊为楚客狂

12-08

3243

安装环境：VirtualBox 操作系统：Ubuntu 16.04 Desktop 注：VirtualBox需要安装扩展包，后面需要用到USB3.0 1、安装ubuntu，安装完毕后ubutu系统中切换镜像源，如切换成阿里云等，开始升级ubuntu sudo apt-get update sudo apt-get upgrade #deb包 deb http://mirrors.aliy...

Oracle Applications Multiple Organizations Access Control for Custom Code

淡

11-06

5838

文档 ID 420787.1 White Paper Oracle Applications Multiple Organizations Access Control for Custom Code Checked for relevance on 12-JAN-2011 See Change Record This document discusses how to

一劳永逸解决Hive执行insert命令调用MR任务报错问题

03-11

5809

一劳永逸_解决Hive执行insert指令集调用MapReduce任务的报错问题

Hive--参数优化、Map、Reduce Task个数优化

qq_41301707的博客

12-16

1799

Hive--优化 Hive中的执行引擎目前支持：MapReduce、Spark、Tez 本文设定的执行引擎为MapReduce 1 Hive--参数优化 Hive官网--参数 1.1 hive.fetch.task.conversion Default Value: minimal in Hive 0.10.0 through 0.13.1, more in Hive 0.14.0 and la...

ES in Hive

阿里Darker

10-10

2157

ElasticSearch已经可以与YARN、Hadoop、Hive、Pig、Spark、Flume等大数据技术框架整合起来使用，尤其是在添加数据的时候，可以使用分布式任务来添加索引数据，尤其是在数据平台上，很多数据存储在Hive中，使用Hive操作ElasticSearch中的数据，将极大的方便开发人员。这里记录一下Hive与ElasticSearch整合，查询和添加数据的配置使用过程。基于Hi

hive中的local mr

东杰书屋

10-22

3521

在hive中运行的sql有很多是比较小的sql,数据量小,计算量小.这些比较小的sql如果也采用分布式的方式来执行,那么是得不偿失的.因为sql真正执行的时间可能只有10秒,但是分布式任务的生成得其他过程的执行可能要1分钟.这样的小任务更适合采用lcoal mr的方式来执行.就是在本地来执行,通过把输入数据拉回客户端来执行. 拿select 1 from dual来看下,两种执行方式的效率差

Hive使用——参数设置

pageniao的博客

11-19

771

1. 设置显示表头信息默认hive命令行所展示出来的表并不显示字段（表头）信息可以通过下面代码设置： set hive.cli.print.header=true; 如下图所示，显示了每列所在数据库及字段信息，但是没有必有显示数据库，显示数据库反而减弱了可读性可以通过下面的代码设置： set hive.resultset.use.unique.column.names=false; ...

hive 分区partition表创建数据导入（动态分区插入、静态分区插入、动静态混合插入）