在hive中创建分区表,再关联到hdfs有关位置,而不需导入数据到hive表

本文介绍了如何在不导入数据到Hive的情况下,通过创建Hive外部表并与HDFS上的数据目录关联,实现直接通过Hive查询HDFS上的结构化数据。详细步骤包括创建外部表、关联HDFS目录以及验证关联是否成功。
摘要由CSDN通过智能技术生成

【需求】有时候我们不想导入数据到hive中,而是通过在hive中创建关联表的方式查询hdfs上的数据,之后就能通过hive客户端或者spark应用程序获取hive的数据了。

【原理】由于在hdfs中已存入了我们提前整理好的结构化数据(例如每条记录都是以逗号分隔),那么在hive中建一个相同结构的表,再把此表关联到相应的hdfs目录就可以了。

下面一个小案例讲一下我的经验。步骤——

步骤一:在hive中创建外部表步骤二:修改hive表,使其关联HDFS指定目录,就能将二者的数据自动关联步骤三:验证是否关联成功


步骤一:在hive中创建外部表
hive> CREATE EXTERNAL TABLE email_ralationship (sender STRING, receiver STRING, copied STRING)
    > PARTITIONED BY (dt STRING)
    > ROW FORMAT DELIMITED
    > FIELDS TERMINATED BY '\073'
    > STORED AS TEXTFILE;
OK
Time taken: 0.319 seconds

[注意点] 这里的字段分隔符'\073'是ascii码表里的分号表示,hive中不能用FIELDS TERMINATED BY ';' 否则报错


步骤二:修改hive表:使其关联HDFS指定目录,就能将二者的数据自动关联

# 报错:访问被拒绝
hive> ALTER TABLE email_ralationship ADD PARTITION (dt="2017-01-09")
    > LOCATION "/apps/tony_kidkid/email_relationship/2017-01-09/2017-01-09";
FAILED: Execution Error, return code 1 from org.apache.
  • 3
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,您可以使用以下步骤来查看HDFSHive数据仓库分区表的所有分区和部分分区数据: 1. 首先要进入到HDFS的命令行界面,可以使用以下命令: ```shell hdfs dfs -ls / ``` 该命令可以列出HDFS根目录下的所有文件和目录。如果您已经知道Hive数据仓库在HDFS上的具体路径,可以直接进入该目录;否则可以使用以下命令查找: ```shell hdfs dfs -ls -R / | grep -i "hive" ``` 该命令会递归地列出HDFS根目录下所有包含"hive"关键字的文件和目录,包括Hive数据仓库所在的目录。 2. 进入到Hive数据仓库所在的目录,例如: ```shell cd /user/hive/warehouse/ ``` 该命令会进入到Hive数据仓库所在的目录,该目录下的子目录对应了不同的Hive。 3. 进入到您要查看的分区表所在的目录,例如: ```shell cd log_data_partitioned/ ``` 该命令会进入到log_data_partitioned分区表所在的目录,该目录下的子目录对应了不同的分区。 4. 使用以下命令查看所有分区的信息: ```shell hdfs dfs -ls . ``` 该命令会列出当前目录下的所有子目录,每个子目录对应了一个分区,并以分区键值命名。例如,如果您的分区键为"date",则每个子目录的名称应该类似于"date=20220101"。 5. 如果您要查看某个分区的数据,可以进入到该分区所在的目录,例如: ```shell cd date=20220101/ ``` 该命令会进入到"date=20220101"分区所在的目录。 6. 使用以下命令查看该分区的部分数据: ```shell hdfs dfs -cat part-m-00000 | head ``` 该命令会显示该分区第一个数据文件(part-m-00000)的前几行数据。您可以根据要修改该命令来查看更多的数据,或者使用其他工具(例如Hive或者Spark)来查询和分析分区表数据
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值