Hive
文章平均质量分 91
SC放牛娃
这个作者很懒,什么都没留下…
展开
-
大数据面试题第一期*4
大数据面试题第一期(4篇)原创 2024-05-11 19:56:51 · 647 阅读 · 1 评论 -
Hive优化方案
Hive的优化方案(可用于面试)原创 2024-05-10 19:41:13 · 817 阅读 · 0 评论 -
Hive大数据任务调度和业务介绍
ZooKeeper和DolphinScheduler的使用原创 2024-05-04 19:25:36 · 2220 阅读 · 1 评论 -
数据仓库设计
数据仓库sql开发,hiveSQL原创 2024-04-29 21:04:54 · 702 阅读 · 0 评论 -
DataX数据采集流程(项目)
dataX数据采集原创 2024-04-26 17:52:12 · 846 阅读 · 3 评论 -
大数据项目介绍
大数据实战项目原创 2024-04-25 21:47:11 · 888 阅读 · 1 评论 -
Hive进阶
ELT是将etl的开发流程进行了调整,使用采集工具采集数据,将数据直接写入hdfs,清洗转化过程可以使用hiveSQL在数仓中执行。资源全部给一个计算任务使用,但是当计算任务中的某个map或reduce计算完成后,可以将自身资源释放掉给其他计算任务使用。2-split切割后的数据传递给对应的map进行处理,会对数据转为kv (张三,1) (张三,1),(李四,1)随着分析需求的改变,数仓中的数据也在不断变化,随着时间推移,统计的字段计算数据也在发生变化。reduce的个数默认是一个;原创 2024-04-15 18:13:48 · 1163 阅读 · 1 评论