大数据
文章平均质量分 69
第十个灵魂
IT运维、软件开发、云架构设计、咨询
展开
-
认识下MapReduce
MapReduce是一种分布式计算模型,最初由Google提出,用于处理大规模数据集的并行计算。它将数据处理任务分解成独立的Map和Reduce两个阶段,以实现分布式计算和并行化处理。Map阶段负责将输入数据映射为键值对,并生成中间结果;Reduce阶段负责将Map阶段输出的中间结果进行汇总和聚合,最终生成最终结果。原创 2024-05-09 10:05:41 · 545 阅读 · 0 评论 -
5分钟了解下HDFS
hadoop HDFS原创 2024-05-09 09:51:12 · 791 阅读 · 0 评论 -
【快捷部署】024_Hive(3.1.3)
快捷部署第024期,Ubuntu 20.04下部署Hive(3.1.3)原创 2024-05-08 08:50:48 · 379 阅读 · 0 评论 -
Hbase基础操作Demo(Java版)
HBase Java基础操作样例原创 2024-05-08 08:34:57 · 1459 阅读 · 0 评论 -
HDFS常用命令总结
HDFS(Hadoop Distributed File System)是Hadoop生态系统中的一个分布式文件系统,用于存储大规模非结构化数据。HDFS提供了命令行工具hdfs dfs来管理HDFS文件和目录。今天总结一下常用的HDFS命令。Hadoop快捷部署请参见:《原创 2024-04-18 08:09:09 · 214 阅读 · 0 评论 -
【快捷部署】021_Hadoop(3.3.2)
快捷部署第021期,Ubuntu 20.04下部署Hadoop(3.3.2)原创 2024-04-18 08:00:46 · 726 阅读 · 1 评论 -
5分钟读懂数仓分层(深入浅出,通俗易懂,建议收藏)
在数据驱动的时代,数据仓库(Data Warehouse)已经成为企业数据分析和决策支持的关键基础设施。而数据仓库分层是构建高效、可扩展和易于维护的数据仓库的核心概念。本文将深入浅出地探讨数据仓库分层的意义、主流分层架构,以及如何进行构建。原创 2024-03-18 15:36:39 · 6085 阅读 · 1 评论 -
Doris基本SQL语句(官方使用指南轻量化)
Doris官方使用指南语句整理,轻量化便于查看学习。原创 2024-03-15 15:59:19 · 1794 阅读 · 0 评论 -
一文看懂Doris数据模型(含样例,建议收藏)
一文看懂Doris数据模型,包含:3种模型总结,模型必备知识,以及3种模型场景体验。原创 2024-03-15 15:33:45 · 2734 阅读 · 0 评论 -
数仓ODS层数据分类及同步形式
数据分类及同步形式原创 2024-03-14 20:10:28 · 546 阅读 · 0 评论 -
【快捷部署】001_Doris(2.0.3)
快捷部署系列,本期带来的是Doris,便于入门学习体验以及技术验证等场景。原创 2024-03-13 08:50:41 · 1246 阅读 · 1 评论 -
【快捷部署】002_Flink(1.17.2)
快捷部署系列,本期带来的是Flink,快速体验、学习原创 2024-03-13 08:40:03 · 1415 阅读 · 0 评论