Hive-tez合并小文件

-》1. hive-sql 方式, 小文件产生和最后的map任务数量有关系

原来是7W多个

查看hive表对应hdfs文件的数量,可以看这里

https://mp.csdn.net/mp_blog/creation/editor/new/129703080

SET hive.merge.tezfiles=true; --开启合并
SET hive.merge.mapfiles = true; --在map only任务结束时合并小文件
SET hive.merge.mapredfiles = true; --为true时在mapreduce任务结束时合并小文件
SET hive.merge.size.per.task = 256000000; --合并文件大小
SET hive.merge.smallfiles.avgsize = 160000000; --文件合并标准(低于16000000kb进行合并)

INSERT overwrite TABLE ods.ods_s4_matdoc
  SELECT *
    FROM ods.ods_s4_matdoc;

执行完后,查询对应hdfs文件数的变化,变成了400多

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: 如果没有hive-site.xml文件,那么可能需要手动创建该文件并配置Hive的相关参数。可以参考Hive官方文档或者其他相关资料来了解如何配置hive-site.xml文件。另外,也可以尝试重新安装Hive,以确保所有必要的文件都被正确安装。 ### 回答2: Hive是一个数据仓库工具,它使得分布式数据访问变得更加容易。hive-site.xml文件包含了Hive的配置信息,是Hive的一个必要文件。如果Hive没有hive-site.xml文件,那么将无法正确地运行和配置。 如果你在安装Hive时发现没有hive-site.xml文件,这可能是因为安装不完整或文件已经被删除。解决这个问题的方法是重新安装Hive或手动创建hive-site.xml文件。 首先,你可以尝试重新安装Hive。在安装时,确保选择正确的选项以安装所有必要的文件,包括hive-site。如果重新安装无法解决问题,你可以手动创建hive-site.xml文件。 创建hive-site.xml文件的方法很简单,只需要按照下面的步骤: 1. 在本地计算机上创建一个空白文本文件。 2. 将文件名更改为hive-site.xml。 3. 打开文本编辑器,并将以下文本复制粘贴到文件中: <configuration> <property><name>hive.metastore.uris</name><value>thrift://localhost:9083</value></property> <property><name>javax.jdo.option.ConnectionURL</name><value>jdbc:mysql://localhost/metastore?createDatabaseIfNotExist=true</value></property> <property><name>javax.jdo.option.ConnectionDriverName</name><value>com.mysql.jdbc.Driver</value></property> <property><name>javax.jdo.option.ConnectionUserName</name><value>hiveuser</value></property> <property><name>javax.jdo.option.ConnectionPassword</name><value>hivepassword</value></property> </configuration> 4. 保存文件并将其放置在Hive的配置目录中。你可以通过查看Hive的文档来了解配置目录的位置。 5. 重启Hive以确保配置文件生效。 总之,缺少hive-site.xml文件可能会导致Hive无法配置和运行。如果重新安装无法解决问题,则可以尝试手动创建一个文件。在手动创建文件时,确保按照Hive的文档将文件放置在正确的位置,并重新启动Hive以使配置生效。 ### 回答3: Hive是一种基于Hadoop平台的数据仓库工具,是Hadoop生态系统中的一个重要组成部分。在使用Hive的过程中,可能会出现没有hive-site.xml文件的情况。那么,这种情况下该如何处理呢? 首先,我们需要知道hive-site.xml文件是什么。该文件Hive的配置文件,用于存放Hive的各种配置参数,如Hive元数据存储路径、HDFS存储地址、Hive执行引擎等参数。因此,没有hive-site.xml文件会导致Hive无法正常运行。为了解决这个问题,我们需要按照以下步骤进行操作: 1. 查找Hive的安装目录,一般情况下,该目录在$HIVE_HOME下。 2. 然后进入conf目录,在该目录下寻找hive-site.xml文件。 3. 如果该文件不存在,可以手动创建该文件,即新建一个名为hive-site.xml的文件。 4. 将需要配置的参数按照XML格式写入文件中。可以参考其他已有的hive-site.xml文件,或者查找相关文档获取参数列表及其含义。 5. 最后,保存该文件,并重新启动Hive服务。 当然,在某些情况下,即使没有hive-site.xml文件也不会影响Hive的正常运行。例如,如果使用集成开发环境(IDE)来编写Hive脚本,该IDE已经为Hive提供了默认的配置参数,因此不需要手动配置。 总之,没有hive-site.xml文件可能是由于Hive的不同版本、不同安装方式等原因导致的。解决该问题的关键在于了解Hive的配置参数及其含义,并进行正确的配置。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值