
Hive
文章平均质量分 79
天地风雷水火山泽
这个作者很懒,什么都没留下…
展开
-
二百七十六、ClickHouse——Hive和ClickHouse非常不同的DWS指标数据SQL语句
ClickHouse——Hive和ClickHouse非常不同的DWS指标数据SQL语句原创 2024-10-31 17:26:29 · 910 阅读 · 0 评论 -
二百六十八、Kettle——同步ClickHouse清洗数据到Hive的DWD层静态分区表中(每天一次)
Kettle——同步ClickHouse清洗数据到Hive的DWD层静态分区表中原创 2024-10-17 14:51:24 · 1238 阅读 · 0 评论 -
二百六十六、Hive——Hive的DWD层数据清洗、清洗记录、数据修复、数据补全
Hive——Hive的DWD层数据清洗、清洗记录、数据修复、数据补全原创 2024-09-19 14:47:08 · 1614 阅读 · 0 评论 -
二百六十五、Hive——目前Hive数仓各层表样例
Hive——目前Hive数仓各层表样例原创 2024-09-19 14:08:35 · 1336 阅读 · 0 评论 -
二百六十一、Java——采集Kafka数据,解析成一条条数据,写入另一Kafka中(简单JSON)
Java——采集Kafka数据,解析成一条条数据,写入另一Kafka中(简单JSON)原创 2024-09-03 15:01:24 · 1114 阅读 · 0 评论 -
二百六十、Java——采集Kafka数据,解析成一条条数据,写入另一Kafka中(复杂JSON)
Java——采集Kafka数据,解析成一条条数据,写入另一Kafka中(复杂JSON)原创 2024-09-03 14:53:06 · 1300 阅读 · 0 评论 -
二百五十九、Java——采集Kafka数据,解析成一条条数据,写入另一Kafka中(一般JSON)
Java——采集Kafka数据,解析成一条条数据,写入另一Kafka中(一般JSON)原创 2024-09-03 14:29:00 · 1890 阅读 · 0 评论 -
二百四十五、海豚调度器——用DolphinScheduler调度执行复杂的HiveSQL(HQL包含多种海豚无法正确识别的符号)
海豚调度器——用DolphinScheduler调度执行复杂的HiveSQL(HQL包含多种海豚无法正确识别的符号)原创 2024-07-22 14:02:25 · 1679 阅读 · 0 评论 -
二百四十四、Hive——Hive中解析复杂JSON,既有对象还有数组,而且数组中包含数组
Hive——Hive中解析复杂JSON,既有对象还有数组,而且数组中包含数组原创 2024-07-16 15:56:27 · 1829 阅读 · 0 评论 -
二百四十二、Hive——Hive的动态分区表出现day=__HIVE_DEFAULT_PARTITION__分区
Hive的动态分区表出现day=__HIVE_DEFAULT_PARTITION__分区原创 2024-06-28 10:29:01 · 736 阅读 · 0 评论 -
二百三十九、Hive——Hive函数全篇
Hive函数全篇原创 2024-06-04 11:40:32 · 1076 阅读 · 0 评论 -
二百三十八、Hive——Hive中为每条数据创建唯一ID
Hive中为每条数据创建唯一ID原创 2024-05-27 10:39:13 · 1266 阅读 · 0 评论 -
二百三十七、Hive——DWS层生成每个清洗字段的异常情况记录
Hive——DWS层生成每个清洗字段的异常情况记录原创 2024-05-21 20:22:24 · 1148 阅读 · 0 评论 -
二百二十九、离线数仓——离线数仓Hive从Kafka、MySQL到ClickHouse的完整开发流程
离线数仓Hive从Kafka、MySQL到ClickHouse的完整开发流程原创 2024-04-02 20:02:29 · 1703 阅读 · 0 评论 -
二百二十八、Hive——HQL报错:删除HDFS中的Hive数据文件导致Xshell连接MySQL异常和HQL查询异常
HQL报错:删除HDFS中的Hive数据文件导致Xshell连接MySQL异常和HQL查询异常原创 2024-03-07 10:33:49 · 609 阅读 · 0 评论 -
二百二十一、Hive——HQL报错:return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask
Hive——HQL报错:return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask原创 2024-01-30 16:23:22 · 1150 阅读 · 0 评论 -
二百一十九、Hive——HQL报错:Caused by: java.util.regex.PatternSyntaxException: Illegal repetition near index 1
HQL报错:Caused by: java.util.regex.PatternSyntaxException: Illegal repetition near index 1原创 2023-12-14 17:35:25 · 1589 阅读 · 0 评论 -
二百一十、Hive——Flume采集的JSON数据文件写入Hive的ODS层表后字段的数据残缺
Flume采集的JSON数据文件写入Hive的ODS层表后字段的数据残缺原创 2023-12-04 09:59:29 · 1681 阅读 · 0 评论 -
二百零九、Hive——with嵌套语句报错:hadoop.hive.ql.parse.SemanticException: Line 2:5 Ambiguous table alias ‘t2‘
Hive——with嵌套语句报错:hadoop.hive.ql.parse.SemanticException: Line 2:5 Ambiguous table alias 't2'原创 2023-12-01 17:19:11 · 1579 阅读 · 0 评论 -
二百零八、Hive——HiveSQL异常:Select查询数据正常,但SQL语句加上group by查询数据为空
HiveSQL异常:Select查询数据正常,但SQL语句加上group by查询数据为空原创 2023-11-28 17:05:53 · 1050 阅读 · 0 评论 -
二百零二、Hive——Hive解析JSON字段(单个字段与json数组)
Hive解析JSON字段(单个字段与json数组)原创 2023-11-15 16:36:21 · 1123 阅读 · 0 评论 -
一百九十、Hive——Hive刷新分区MSCK REPAIR TABLE
Hive——Hive刷新分区MSCK REPAIR TABLE原创 2023-10-17 10:31:35 · 1268 阅读 · 1 评论 -
一百八十八、Hive——HiveSQL查询表中的日期是星期几(亲测,附截图)
HiveSQL查询表中的日期是星期几(亲测,附截图)原创 2023-09-26 20:03:07 · 2833 阅读 · 0 评论 -
一百八十一、Hive——海豚调度HiveSQL任务时当Hive的计算引擎是mr或spark时脚本的区别(踩坑,附截图)
海豚调度HiveSQL任务时当Hive的计算引擎是mr或spark时脚本的区别(踩坑,附截图)原创 2023-09-21 20:52:27 · 662 阅读 · 0 评论 -
一百七十七、Hive——海豚调度执行Hive的.sql文件
海豚调度执行Hive的.sql文件原创 2023-09-14 16:49:28 · 661 阅读 · 0 评论 -
一百七十四、Hive——Hive动态分区表加载数据时需不需要指定分区名?
Hive动态分区表加载数据时需不需要指定分区名?原创 2023-09-12 17:38:00 · 712 阅读 · 0 评论 -
一百三十七、Hive——HQL运行报错(持续更新中)
HQL运行报错原创 2023-07-28 14:58:48 · 1820 阅读 · 0 评论 -
一百三十三、Hive——Hive外部表加载含有JSON格式字段的CSV文件数据
Hive外部表加载含有JSON格式字段的CSV文件数据原创 2023-07-24 11:44:32 · 1047 阅读 · 0 评论 -
一百三十一、海豚调度器——海豚调度Hive on Spark任务报错Failed to create Spark client for Spark session
海豚调度Hive on Spark任务报错Failed to create Spark client for Spark session原创 2023-07-20 21:12:44 · 938 阅读 · 1 评论 -
一百三十、海豚调度器——用DolphinScheduler定时调度HiveSQL任务
用海豚调度器定时调度HiveSQL任务原创 2023-07-17 19:23:00 · 6123 阅读 · 2 评论 -
一百二十八、Kettle——从Hive增量导入到ClickHouse(根据create_time字段判断)
Kettle——从Hive增量导入到ClickHouse(根据create_time字段判断)原创 2023-07-12 20:01:21 · 983 阅读 · 0 评论 -
一百二十五、Hive——hive性能优化
hive性能优化原创 2023-06-15 09:34:50 · 938 阅读 · 1 评论 -
一百二十、Kettle——从Hive全量导入到ClickHouse
用kettle把Hive数据同步到ClickHouse原创 2023-05-31 14:15:22 · 1190 阅读 · 0 评论 -
一百一十四、(已解决)kettle报错:从hive到clickhouse code: 1002, DB::Exception: Syntax error: failed at position
kettle报错:从hive到clickhouse code: 1002, DB::Exception: Syntax error: failed at position原创 2023-05-16 17:08:39 · 2616 阅读 · 2 评论 -
一百一十三、DBeaver——从hive同步数据到clickhouse
DBeaver——从hive同步数据到clickhouse原创 2023-05-16 16:39:21 · 1892 阅读 · 0 评论 -
一百一十二、Hive——Exception when loading 4 in table dm_evaluation_1hour with loadPath=hdfs
HiveSQL——分区字段一定要放在SQL里字段的最后位置,否则就会报错原创 2023-05-15 14:02:25 · 1112 阅读 · 0 评论 -
一百一十一、Hive——从HDFS到Hive的数据导入(静态分区、动态分区)
从HDFS到Hive的数据导入(静态分区、动态分区)原创 2023-05-11 20:32:42 · 4265 阅读 · 0 评论 -
一百一十、Hive时间转换——from_unixtime踩坑(不要用from_unixtime,而是用from_utc_timestamp)
不要用from_unixtime,而是用from_utc_timestamp原创 2023-05-10 15:04:01 · 1168 阅读 · 0 评论 -
一百零六、Hive312的计算引擎由MapReduce(默认)改为Spark(亲测有效)
Hive312的计算引擎由MapReduce(默认)改为Spark原创 2023-04-24 10:43:33 · 4097 阅读 · 10 评论 -
一百零二、Hive——hive设置元数据支持中文显示
hive设置元数据支持中文显示原创 2023-04-13 13:53:51 · 933 阅读 · 0 评论