自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(34)
  • 收藏
  • 关注

原创 Git—入门知识点梳理

Git入门概述

2023-03-03 16:31:23 196

原创 Maven—入门知识点梳理

Maven入门概述

2023-01-29 16:32:02 249

原创 大数据—Hive(八)_自定义函数

Hive 不同于传统的数据库,将存储与计算分离

2023-01-18 09:00:00 172 1

原创 大数据—Hive(七)_ 分区表和分桶表

Hive 不同于传统的数据库,将存储与计算分离

2023-01-17 00:41:17 996

原创 大数据—Hive(六)_ DML数据查询(区别四种by)

Hive 不同于传统的数据库,将存储与计算分离

2023-01-12 22:31:43 98

原创 大数据—Hive(五)_ DML数据操作(对数据的增删改)

Hive 不同于传统的数据库,将存储与计算分离

2022-12-27 16:20:21 129

原创 大数据—Hive(四)_ DDL数据定义(对数据库、表的增删改)

Hive 不同于传统的数据库,将存储与计算分离

2022-12-24 23:01:31 173

原创 大数据—Hive(三)_ 数据类型

Hive 不同于传统的数据库,将存储与计算分离

2022-12-16 23:59:24 115

原创 大数据—Hive(二)_ 安装

Hive 不同于传统的数据库,将存储与计算分离

2022-12-05 23:35:50 165

原创 大数据—Hive(一)_ 基本概念

Hive 不同于传统的数据库,将存储与计算分离

2022-11-28 16:05:30 548

原创 Hadoop目录

阅读导航

2022-11-23 16:37:49 394

原创 大数据—Hadoop(二十三)_ 生产调优手册_06、HDFS_企业开发场景案例(参数调优汇总)

相互指正,相互学习

2022-11-23 14:38:32 126

原创 大数据—Hadoop(二十二)_ 生产调优手册_05、MapReduce

相互指正,相互学习

2022-11-20 14:45:20 929

原创 大数据—Hadoop(二十一)_ 生产调优手册_04、HDFS(4)_故障排除

相互指正,相互学习

2022-11-16 10:39:50 540

原创 大数据—Hadoop(二十)_ 生产调优手册_03、HDFS(3)_集群扩容及缩容

相互指正,相互学习

2022-11-13 23:06:42 355

原创 大数据—Hadoop(十九)_ 生产调优手册_02、HDFS(2)_集群压测、多目录

相互指正,相互学习

2022-11-09 11:42:14 311

原创 大数据—Hadoop(十八)_ 生产调优手册_01、HDFS(1)_核心参数

相互指正,相互学习

2022-11-07 17:32:17 591

原创 大数据—Hadoop(十七)_ Yarn_03、实操配置

Yarn资源管理协调软件,解耦了计算本身和计算管理两件事情,让后续出现的Tez、Spark、Flink等框架都能通过Yarn来管理资源,只处理自身擅长的数据计算工作

2022-11-06 09:00:00 625

原创 大数据—Hadoop(十六)_ Yarn_02、命令行操作和核心参数配置

Yarn资源管理协调软件,解耦了计算本身和计算管理两件事情,让后续出现的Tez、Spark、Flink等框架都能通过Yarn来管理资源,只处理自身擅长的数据计算工作

2022-11-03 09:00:00 1977

原创 大数据—Hadoop(十五)_ Yarn_01、概念

Yarn资源管理协调软件,解耦了计算本身和计算管理两件事情,让后续出现的Tez、Spark、Flink等框架都能通过Yarn来管理资源,只处理自身擅长的数据计算工作

2022-10-31 08:30:00 270

原创 大数据—Hadoop(十四)_ MapReduce_07、压缩

MapReduce将数据的计算,简单分成Map和Reduce两个阶段。Map阶段,将原本很大的数据集拆分成多个小份,在不同服务器上各个击破。Reduce阶段,则将原本小份的数据结果汇总,进一步计算,得到最终结果。

2022-10-25 16:07:53 176

原创 大数据—Hadoop(十三)_ MapReduce_06、核心框架原理_源码(3)_MapTask & ReduceTask

MapReduce将数据的计算,简单分成Map和Reduce两个阶段。Map阶段,将原本很大的数据集拆分成多个小份,在不同服务器上各个击破。Reduce阶段,则将原本小份的数据结果汇总,进一步计算,得到最终结果。

2022-10-24 16:57:51 631

原创 大数据—Hadoop(十二)_ MapReduce_05、核心框架原理_源码(2)_切片机制

MapReduce将数据的计算,简单分成Map和Reduce两个阶段。Map阶段,将原本很大的数据集拆分成多个小份,在不同服务器上各个击破。Reduce阶段,则将原本小份的数据结果汇总,进一步计算,得到最终结果。

2022-10-23 15:05:41 310

原创 大数据—Hadoop(十一)_ MapReduce_04、核心框架原理_源码(1)_ Job提交流程

MapReduce将数据的计算,简单分成Map和Reduce两个阶段。Map阶段,将原本很大的数据集拆分成多个小份,在不同服务器上各个击破。Reduce阶段,则将原本小份的数据结果汇总,进一步计算,得到最终结果。

2022-10-22 10:28:07 312

原创 大数据—Hadoop(十)_ MapReduce_03、核心框架原理

MapReduce将数据的计算,简单分成Map和Reduce两个阶段。Map阶段,将原本很大的数据集拆分成多个小份,在不同服务器上各个击破。Reduce阶段,则将原本小份的数据结果汇总,进一步计算,得到最终结果。

2022-10-21 09:00:00 788

原创 大数据—Hadoop(九)_ MapReduce_02、序列化

MapReduce将数据的计算,简单分成Map和Reduce两个阶段。Map阶段,将原本很大的数据集拆分成多个小份,在不同服务器上各个击破。Reduce阶段,则将原本小份的数据结果汇总,进一步计算,得到最终结果。

2022-10-18 08:41:21 323

原创 大数据—Hadoop(八)_ MapReduce_01、概述

MapReduce将数据的计算,简单分成Map和Reduce两个阶段。Map阶段,将原本很大的数据集拆分成多个小份,在不同服务器上各个击破。Reduce阶段,则将原本小份的数据结果汇总,进一步计算,得到最终结果。

2022-10-14 12:43:50 464

原创 大数据—Hadoop(七)_ HDFS_06、Datanode

HDFS分布式文件管理系统

2022-10-13 10:36:04 302

原创 大数据—Hadoop(六)_ HDFS_05、NameNode 和 Secondary NameNode

HDFS分布式文件管理系统

2022-10-12 08:47:56 234

原创 大数据—Hadoop(五)_ HDFS_04、HDFS的读写流程

HDFS分布式文件管理系统

2022-10-11 08:57:47 147

原创 大数据—Hadoop(四)_ HDFS_03、客户端API

HDFS分布式文件管理系统

2022-10-10 16:28:17 657

原创 大数据—Hadoop(三)_ HDFS_02、Shell相关操作

HDFS分布式文件管理系统

2022-10-09 21:28:56 112

原创 大数据—Hadoop(二)_ HDFS_01、概述

HDFS分布式文件管理系统

2022-10-05 18:48:29 204

原创 大数据—Hadoop(一)_ Hadoop入门概念

相互指正,相互学习

2022-10-02 22:26:22 298

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除