Hive
文章平均质量分 64
Apache Hive™数据仓库软件通过SQL实现对分布式存储中的大型数据集的读写和管理。结构可以投射到存储中的数据上。Hive提供命令行工具和JDBC驱动程序连接用户。
冷漠;
我很懒,还没有添加简介
展开
-
hive中get_json_object函数不支持解析json中文key
hive中get_json_object函数不支持解析json中文key原创 2023-08-18 15:35:33 · 1303 阅读 · 0 评论 -
Hive 分区表新增字段 cascade
Hive 分区表新增字段 cascade原创 2023-03-14 18:30:25 · 3501 阅读 · 0 评论 -
Hive实现日期维表
首先要实现一个日期列表,这里可以使用 函数,比如说我们想要 [2022-12-01, 2022-12-31] 的日期列表,具体实现如下:函数解释:上述日期列表有了之后,具体日期维度的求解相对来说就比较简单了,各个维度的具体求解如下:获取月获取日获取时获取分获取秒当前时间是一年中的第几周所在周的第几天当前日期所在周的下周周几的日期函数:next_day(string start_date, string day_of_week)day_of_原创 2022-12-07 18:15:26 · 1980 阅读 · 0 评论 -
Hive中date_format()函数的用法
格式化日期时间,将日期按照自己想要的格式输出。date_format(date, format):date参数是合法的日期,format参数是规定日期输出的格式。4. 常用的符号标识可参考Hive官网中 date_format() 函数的描述。获取年月日时分秒:原创 2022-12-06 16:14:55 · 19336 阅读 · 0 评论 -
Hive中split函数分隔符为分号时报错问题
Hive中split函数分隔符为分号时报错问题 Error while compiling statement: FAILED: ParseException line 1:17 cannot recognize input near '' '' '' in select expression原创 2022-11-01 16:39:22 · 1964 阅读 · 1 评论 -
获取Hive每日增量更新数据
求 Hive 表中每天最新分区的增量数据原创 2022-10-28 16:17:39 · 2000 阅读 · 0 评论 -
Hive习题汇总(持续汇总中)
Hive SQL 习题汇总(持续汇总中)原创 2022-08-05 14:36:10 · 677 阅读 · 0 评论 -
Spark运行任务时报错:org.apache.hadoop.hdfs.protocol.DSQuotaExceededException: The DiskSpace quota of...
org.apache.spark.SparkException:Task failed while writing rows.Caused by: org.apache.hadoop.hdfs.protocol.DSQuotaExceededException: The DiskSpace quota of /user/hive/warehouse/hs_data_odsdb.db is exceeded: quota = 13194139533312 B = 12 TB but diskspace ..原创 2022-07-26 17:13:04 · 2317 阅读 · 0 评论 -
Hive报错FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask
Hive报错FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask原创 2022-07-05 16:21:25 · 2026 阅读 · 0 评论 -
hive50道习题练习
hive 习题练习原创 2021-12-19 23:07:37 · 981 阅读 · 0 评论 -
hive建表注释中文乱码问题(desc/show create table中文乱码问题)
Hive建表注释中文乱码问题(desc/show create table)hive建表注释中文乱码问题问题描述:create table test( id int comment '测试id', name string comment '测试姓名')comment '测试用表';使用上述建表语句,建表完成后,使用desc test/desc formatted test或者show create table test,看见的中文解释均为乱码。问题原因:针对 MySQL 字符集的问原创 2021-12-05 01:44:26 · 4746 阅读 · 3 评论 -
idea 中连接 hive
一、添加依赖hive-jdbc 中虽然包括 hadoop-common 的依赖,但是不会主动引入 hadoop-common 的依赖,需要主动添加<!--添加所用hive版本的jdbc依赖 --><dependency> <groupId>org.apache.hive</groupId> <artifactId>hive-jdbc</artifactId> <version>1.2.1原创 2021-11-07 15:27:23 · 15187 阅读 · 6 评论 -
hive中一张表内查找数据重复的问题
先说一下自己的理解:下面的col1其实是一个可以根据这个字段查出整行数据的(类似于主键),如果不能确定的话那就将所有字段都写上如何快速确定一张表内是否有重复数据:select count(col1), count(distinct col1) from table;查询一张表内重复数据的方法有三种:1、group byselect col1, count(1) from table group by col1having count(1) > 1; --求出有重复数据的行-- hav原创 2021-11-06 14:39:13 · 7986 阅读 · 3 评论