hive load from hdfs出错

最新推荐文章于 2022-09-27 13:03:06 发布

ibenben.org

最新推荐文章于 2022-09-27 13:03:06 发布

阅读量7.1k

点赞数

分类专栏： Hadoop 文章标签： Hadoop Hive load

本文链接：https://blog.csdn.net/jrainbow/article/details/9234665

版权

Hadoop 专栏收录该内容

15 篇文章

订阅专栏

本文介绍了一个关于使用HiveQL进行LoadData操作时遇到的错误，并给出了正确的解决方案。错误提示为路径不合法，通过将IP地址替换为别名解决了问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

使用hive load从hdfs中load data的时候，hiveql如下:

load data inpath 'hdfs://192.168.0.131:9000/hive/test.log'
overwrite into table test_log
partition(dt="20130703");

出错：

FAILED: SemanticException [Error 10028]: Line 1:17 Path is not legal ''hdfs://192.168.0.131:9000/hive/test.log'': Move from: hdfs://192.168.0.131:9000/hive/test.log to: hdfs://namenode:9000/home/hadoop/hive/warehouse/test_log/dt=20130703 is not valid. Please check that values for params "default.fs.name" and "hive.metastore.warehouse.dir" do not conflict.

查找度娘、谷哥没找到相应的解决方案。后来回头一想，之前在做hbase的一些操作的时候，直接使用ip也不行，转换成别名即可。

load data inpath 'hdfs://namenode:9000/hive/test.log'
overwrite into table test_log
partition(dt="20130703");

尝试之下，再次测试，成功执行。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

ibenben.org

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

hive ,从hdfs把数据文件load导入到表

Top5软件工程硕士，先后在京东、字节从事多年Java后端开发、实时和离线大数据开发

04-27

2万+

hive> load data inpath 'hdfs://ns1/abc/sales_info/hello/sales_info.txt' overwrite into table sales_info partition(dt = '2019-04-26'); 1 原数据文件（已经不存在了，是从原路径移动到了新路径下）：如果从本地导入后本地的原数据文件依然存在，相当于复制过去；...

最容易出错的 Hive Sql 详解

奋斗的阿杰的博客

08-17

543

最容易出错的 Hive Sql 详解

参与评论您还未登录，请先登录后发表或查看评论

HIVE_HIVE_load data_TO_HDFS，从hdfs上导入hive分区

迎难而上

06-04

833

大致语法如下： LOAD DATA [LOCAL] INPATH '/path/to/local/files' OVERWRITE INTO TABLE table_name [PARTITION ( pt = 'partion-key' [,....] )] ; 作用：将本地或者hdfs上的数据导入hive表 LOCAL 有 LOCAL 表示从本地文件系统（文件会被拷贝到 HDFS 中）无 LOCAL 表示从HDFS中加载数据（注意：文件直接被移动 !!! 而不是拷...

hive从hdfs迁移数据load第二次失败

xxl0769的博客

12-23

939

第一次迁移被删后，第二次失败，重新建表就好了报错信息：数据清理不干净

Hive Load装载数据与HDFS的关系

CharlesCFA的博客

02-19

1818

装载数据：LOAD移动数据 LOCAL：指定文件位于本地文件系统；OVERWRITE表示覆盖现有数据使用方法： -- load数据格式 LOAD DATA LOCAL INPATH '/home/dayongd/Downloads/employee.txt' OVERWRITE INTO TABLE employee; -- 方式一：LOCAL表示文件位于本地，OVERWRITE表示覆盖现有数据 LOAD DATA LOCAL INPATH '/home/dayongd/Downloads/empl

从零开始大数据--Hadoop、HDFS、MapReduce、HBase、Hive

MOKE_SPACE

05-21

3216

文章目录概述HadoopHDFSHBase实现原理Regin服务器原理HBase安装与使用NoSQL数据库MapReduceHive 概述 IT领域每隔十五年就会迎来一次重大变革： 1980：个人计算机 1995：互联网 2010：物联网、云计算和大数据信息科技为大数据时代提供技术支撑：存储设备容量不断增加 CPU处理能力大幅提升网络带宽不断增加大数据是由结构化和非结构化数据组成的 10%的结构化数据，存储在数据库中 90%的非结构化数据，它们与人类信息密切相关大数据技术的不同层面

Hive加载数据的几种方式

阿尼古

03-26

3210

Hive加载数据的几种方式 1、load data 加载数据方式 2、insert 方式进行加载数据 3、from table 多重插入数据方式不多bb，主要介绍一下，多重插入数据方式 1、load data 方式 load装载数据 LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [...

日常使用过程中易出错的 Hive Sql 合集

StoneWords的博客

09-27

290

结果是错误的，把所有的电器类型都查询出来了，原因就是 and 优先级高于 or，上面的sql语句实际执行的是，先找出 classify = '家具' and price>100 的，然后在找出 classify = '电器' 的。在进行数仓搭建和数据分析时最常用的就是 sql，其语法简洁明了，易于理解，目前大数据领域的几大主流框架全部都支持sql语法，包括 hive，spark，flink等，所以sql在大数据领域有着不可替代的作用，需要我们重点掌握。

【若泽大数据实战第十七天】Hive - DDL + DML Hive日志路径修改

强悍de巨人

06-06

1032

前言：上一个章节，若泽给我们讲的第一堂课Hive，详细的总结了，有关Hive的各种信息，本次课程讲讲Hive的 DDLDatabaseHive中包含了多个数据库，默认的数据库为default，对应于HDFS目录是/user/hadoop/hive/warehouse，可以通过hive.metastore.warehouse.dir参数进行配置（hive-site.xml中配置）TableHive中...

hive报错汇总

qnstar_的博客

09-24

598

【错误1】 WARN: Establishing SSL connection without server’s identity verification is not recommended. According to MySQL 5.5.45+, 5.6.26+ and 5.7.6+ requirements SSL connection must be established by default if explicit option isn’t set. For compliance with e

FAILED: SemanticException Line 1:17 Invalid path ''input'': No files matching path hdfs://localhost:

热门推荐

谢三岁的博客

05-14

1万+

load data inpath出错原因及解决方法(把Hadoop下的文件加载到HIve一个表中出错) 问题：今天做实验时，想把hadoop下的input文件加载到Hive下的数据库的一个表时，报错提示没有路径不对，没有找到input文件 FAILED: SemanticException Line 1:17 Invalid path ‘‘input’’: No files matching path hdfs://localhost:9000/user/hadoop/input 可是，我hadoop的

Error: Error while compiling statement: FAILED: SemanticException Unable to load data to destination

miao1997的博客

04-13

1万+

ods层新加了一张表，和以前的格式一样 DROP TABLE IF EXISTS ods_students_industry_level; CREATE TABLE `ods_students_industry_level` ( `id` INT COMMENT '编号', `first_industry` STRING COMMENT '一级行业', `second_industry` STRING COMMENT '二级行业', `parent_id` INT COMMENT '父级

hiveserver2查询操作报错Error while compiling statement等

技术探求

02-22

9000

1 问题产生背景更换hive客户端还使用原先的关系型数据库（我用的是mysql）的metastore 2 报错信息 Error: Error while compiling statement: FAILED: SemanticException Unable to fetch table emp. Exception thrown when executing query : SELECT DISTINCT 'org.apache.hadoop.hive.metastore.model.MTable'

【大数据开发】Hive错误

白色风车

09-19

5005

Hive错误错误1： org.apache.thrift.transport.TTransportException: java.net.SocketException: Connection reset by peer: socket write error 解决方式： mysql数据库连接太久了，断开重连错误2： SemanticException [Error 10001]: Line 2:5 Table not found 'student' 解决方式：语言异常：找不到表student 指定

SemanticException

JavaBigData的博客

12-15

3073

日期格式更改为2020-01-01 FAILED: SemanticException Line 2:17 Invalid path ‘’/origin_data/gmall/log/topic_event/2020-1-1’’: No files matching path hdfs://hadoop102:9000/origin_data/gmall/log/topic_event/2020-...

[Hive]FAILED: SemanticException org.apache.hadoop.hive.ql.metadata.HiveException

Balmunc的专栏

07-19

1万+

show databases命令报错 FAILED: SemanticException org.apache.hadoop.hive.ql.metadata.HiveException: java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaSto...

在hive中遇到的错误

weixin_30367169的博客

12-26

745

1：如果在将文件导入到hive表时，查询结果为null(下图) 这个是因为在创建表的时候没有指定列分隔符，hive的默认分隔符是ctrl+a(/u0001) 2.当我复制好几行sql到hive命令行时，会出现下面情况，导致复制失败这个是因为我的sql中有tab的缩进，将tab的空格去掉即可 3.当我在使用load加载数据是，抛出filad ...

在 hive 中将分析完成的数据直接写入 MySQL 中，只使用 hive 不借助其他工具可以完成吗

最新发布

03-11

<think>嗯，用户问的是在Hive中能不能直接把分析好的数据写到MySQL里，而且不用其他工具，只用Hive本身。这个问题我得仔细想想。首先，Hive本身主要是用来处理大数据集的查询和分析的，它通常是把数据存储在HDFS或者类似的分布式文件系统里。Hive的默认功能是把结果导出到文件，比如CSV或者Hive表里。但用户想直接写到MySQL，这就需要Hive有直接连接MySQL并写入的能力。我记得Hive有一个外部表的功能，可以通过JDBC连接外部数据库。也就是说，可以创建一个指向MySQL表的外部表，然后通过Hive的INSERT语句把数据插进去。这样的话，理论上是可以的，不需要其他工具。不过可能需要配置JDBC驱动和相关的连接信息。具体步骤的话，应该是首先把MySQL的JDBC驱动放到Hive的lib目录下，或者集群的某个地方，确保Hive能访问到。然后在Hive里创建一个外部表，指定存储为JDBC，配置好URL、驱动类、用户名密码等信息。之后就可以用INSERT INTO这个外部表的方式来写入数据了。不过需要注意的地方可能有很多，比如网络连通性，Hive节点能否访问MySQL服务器，权限是否正确，还有数据类型映射的问题。比如Hive中的某些类型可能和MySQL的不完全匹配，需要处理。另外，性能方面可能也是个问题，因为通过JDBC逐条写入可能不如批量导入工具高效，特别是数据量大的时候可能会比较慢或者出错。另外，用户可能没有提到是否需要定时或者自动化的操作。如果只是偶尔一次性的导出，这种方法可行，但如果需要频繁或定时任务，可能需要结合其他调度工具，但用户要求只用Hive，所以可能得用Hive脚本配合cron job之类的，不过那就不算Hive本身的功能了。还有，Hive的事务支持情况如何？如果写入过程中出现错误，是否有回滚机制？可能Hive本身的事务支持有限，尤其是在写入外部数据库时，需要确保操作的原子性，可能需要应用层处理。总结下来，步骤大致是配置JDBC驱动，创建外部表，然后INSERT写入。但需要注意驱动兼容性、网络、权限、数据类型和性能问题。用户可能需要根据具体情况调整配置，或者处理可能出现的错误。</think>在 Hive 中直接将分析结果写入 MySQL 数据库是**可以实现的**，且无需借助其他工具。以下是具体实现方法和步骤： --- ### 一、核心原理通过 Hive 的 **`Hive JDBC StorageHandler`** 功能，将 MySQL 表映射为 Hive 外部表，利用 Hive SQL 的 `INSERT` 操作实现数据写入。 --- ### 二、实现步骤 #### 1. 准备 MySQL JDBC 驱动 - **下载驱动**：获取 MySQL Connector/J 驱动（如 `mysql-connector-java-8.0.x.jar`）。 - **部署驱动**： - 将 JAR 包上传到 Hive 服务端的 `$HIVE_HOME/lib` 目录。 - 同时在 Hadoop 集群的 `$HADOOP_CLASSPATH` 中包含该驱动路径（需重启 Hive 服务生效）。 #### 2. 创建 Hive 外部表映射 MySQL 表 ```sql -- 语法示例 CREATE EXTERNAL TABLE hive_mysql_mapping_table ( id INT, name STRING, value DOUBLE ) STORED BY 'org.apache.hadoop.hive.jdbc.storagehandler.JdbcStorageHandler' TBLPROPERTIES ( "mapred.jdbc.driver.class" = "com.mysql.jdbc.Driver", "mapred.jdbc.url" = "jdbc:mysql://mysql_host:3306/database_name", "mapred.jdbc.username" = "your_username", "mapred.jdbc.password" = "your_password", "mapred.jdbc.input.table.name" = "target_mysql_table" ); ``` #### 3. 写入数据到 MySQL ```sql -- 将 Hive 分析结果插入映射表 INSERT INTO TABLE hive_mysql_mapping_table SELECT id, name, value FROM hive_source_table WHERE ...; ``` --- ### 三、注意事项 1. **权限问题**： - Hive 需有 MySQL 表的写入权限。 - 确保 Hadoop 集群节点可访问 MySQL 服务端口。 2. **数据类型映射**： - Hive 的 `STRING` 对应 MySQL 的 `VARCHAR`/`TEXT`。 - Hive 的 `DOUBLE` 对应 MySQL 的 `DOUBLE`。 - 需手动检查类型兼容性。 3. **性能优化**： - 批量写入：通过调整 Hive 参数（如 `hive.exec.reducers.bytes.per.reducer`）控制写入批次。 - 索引影响：若 MySQL 目标表有索引，写入速度会显著下降。 --- ### 四、替代方案（纯 Hive 实现）若遇到兼容性问题，可通过两步操作实现： 1. 将 Hive 结果导出到 HDFS： ```sql INSERT OVERWRITE DIRECTORY '/tmp/hive_result' SELECT ... FROM ...; ``` 2. 使用 `LOAD DATA INFILE` 从 HDFS 加载到 MySQL（需 MySQL 服务器权限）。 --- ### 五、适用场景 - **小规模数据**：适合 JDBC 直接写入。 - **周期性任务**：可配合 Hive 调度工具（如 Oozie）实现自动化。 --- 通过上述方法，仅依赖 Hive 即可完成数据分析到 MySQL 的写入流程，但需根据数据规模和环境配置调整优化策略。