自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(129)
  • 收藏
  • 关注

原创 Pod控制器详解

Pod控制器是管理pod的中间层,使用Pod控制器之后,只需要告诉Pod控制器,想要多少个什么样的Pod就可以了,它会创建出满足条件的Pod并确保每一个Pod资源处于用户期望的目标状态。如果Pod资源在运行中出现故障,它会基于指定策略重新编排Pod。

2024-01-10 10:03:18 1164

原创 k8s集群搭建

由于默认拉取镜像地址k8s.gcr.io国内无法访问,这里指定阿里云镜像仓库地址,【执行上述命令会比较慢,因为后台其实已经在拉取镜像了】,我们 docker images 命令即可查看已经拉取的镜像。status 为NotReady,表示master节点已经运行了,但是还是处于未准备状态,需要在slave节点执行其他命令,将 slave1和slave2节点加入到maste节点。8、master节点创建token,默认的token有效期是24小时,也可以创建永久有效的token。

2024-01-06 15:37:30 925

原创 配置ssh免密登录

3.只需要将cdh-hadoop1也就是集群中的master节点上的公钥拷贝到其他所有节点即可。集群的通信只需要master节点能连接所有worker节点即可。输入ssh-keygen -t rsa 敲三次回车。2、将公钥拷贝到集群的所有节点中。

2024-01-02 21:54:38 542

原创 blackbox-exporter使用

其中/opt/module/blackbox-exporter/blackbox_exporter-0.24为本机的blackbox_exporter安装路径,各位看官老爷可以根据自己的实际路径作修改。因为在prometheus.yml文件中创建的匹配规则为alert-rules-*.yml,所以此处创建的配置文件能被识别到。在prometheus的安装节点上修改prometheus的配置文件,我的路径为。访问blackbox-exporter的安装节点的IP+端口号。重启prometheus服务。

2023-12-28 00:11:25 743

原创 Grafana二进制部署并配置prometheus数据源

用户名/密码:admin/admin#第一次需要重置密码。输入prometheus主机的安装主机的ip地址和端口号。我的为http://192.168.0.21:9090。我的将密码修改为admin1 方便记。选择 DATA SOURCES。选择Prometheus。

2023-12-24 21:59:18 649

原创 prometheus二进制安装

但此时 Prometheus 还获取不到任何数据,我们还需要配置下 prometheus.yml 文件,让其去拉取 Node Exporter 的数据。NodeExporter 是 Prometheus 官方提供的一个可以采集到主机信息的应用程序,它能采集到机器的 CPU、内存、磁盘等信息。1、在需要安装prometheus的目录下执行wget命令下载软件到本地,如我的路径是/opt/module/prometheus。在页面Status------>targets查看节点信息。在解压后的目录下后台运行。

2023-12-24 14:05:54 257

原创 CentOS中docker安装及镜像源配置

1、首先配置docker的阿里yum源。2、用yum方式安装docker。3配置docker多镜像源配置。4、重启docker。

2023-12-23 16:41:57 820

原创 Hadoop的YARN高可用

Hadoop2.0即第二代Hadoop,由分布式存储系统HDFS、并行计算框架MapReduce和分布式资源管理系统YARN三个系统组成,其中YARN是一个资源管理系统,负责集群资源管理和调度,MapReduce则是运行在YARN上的离线处理框架。YARN 一种开源的分布式资源管理和作业调度技术,它是作为Apache Hadoop 的核心组件之一,负责将系统资源(计算、存储和网络资源)分配给运行在Hadoop集群中的各种应用程序,并对运行在各集群节点上的任务进行调度。

2023-09-19 13:48:50 589

原创 Hadoop的HDFS高可用方案

Hadoop 高可用 (High Availability) 分为 HDFS 高可用和 YARN 高可用,两者的实现基本类似,但 HDFSNameNode 对数据存储及其一致性的要求比 YARN ResourceManger 高得多,所以它的实现也更加复杂1、HDFS系统高可用简介HDFS高可用的核心:NameNode高可用,部署多个NameNode,同时实现数据的同步和故障切换Active NameNode 和 Standby NameNode。

2023-09-19 13:48:46 782

原创 离线数仓分层

对业务模型进行抽象处理成一个个业务概念实体,最常见的就是E-R模型,与具体数据库系统无关,必须转化为逻辑或者物理数据模型才能在数据库系统中实现,概念模型就像是er图记录整体概览,包括了每一步操作,像是大图展示。按照主题域、颗粒度(例如买家、卖家)划分,按照周期粒度、维度聚合形成指标较多的宽表,用于提供后续的业务查询,数据应用,最重要一点需要在DWS层完成指标口径统一及沉淀。是数仓明细数据层,对ODS层的数据进行关联,清洗,维度退化(将维度表中维度数据放入明细表中),转换,主题域建设等操作。

2023-05-25 17:55:21 724

原创 数仓模型建设基本流程

颗粒度必须拆分为不可拆分为止,即最小颗粒度。该主题域下参与的各方全都拆分出来,直到不可再拆分为止,拆分出的粒度代表一条最基础的业务含义。围绕着业务过程来设计,通过获取描述业务过程的度量来表达业务过程,包含了引用的维度和与业务过程有关的度量。对当前业务场景或业务sop进行拆分完成对应主题建设。对场景下数值类型的数据记录。对当前场景描述及补充。

2023-05-20 19:17:39 488

原创 数仓建设架构和数据架构

一、数仓建设架构二、数仓数据架构

2023-04-21 10:46:50 201

原创 常见的九种大数据分析模型

亦或者,存在被低估的情况?分布分析主要能够提供「维度指标化」之后的数据分解能力,将原有维度按照一定的数值区间进行维度划分,进而分析每个维度区间的分布情况,在以下分析场景中十分常见:分析订单的金额分布、分析某类特殊事件的发生时段分布、分析某类特殊事件的发生次数分布、分析触发某类事件的用户年龄分布。通过属性分析,可以快速查看在不同属性上的用户数分布情况,便于统计不同特征的用户总量,在使用属性分析的过程中,需要合理选择度量方式,常用的度量方式包括:用户数、去重数、总和、最大值、最小值、均值等。

2023-04-14 10:51:50 5768

原创 银行数仓分层架构

银行数仓分层

2023-04-13 13:45:26 2021

原创 大数据电商项目常见八大类指标

电商中常见的统计指标

2023-03-18 20:07:52 348

原创 Hive中的高阶函数(二)

hive中的高阶函数

2023-03-01 21:32:25 804

原创 Hive中的基础函数(一)

hive基础函数

2023-03-01 17:49:04 1537

原创 漏斗分析法

数据分析---漏斗分析法

2023-02-23 17:00:25 1240

原创 指标体系的应用与搭建

数仓指标体系的应用与搭建

2023-02-17 14:06:13 493

原创 用户标签体系建设

用户标签提体系建设

2023-02-10 22:53:25 2792

原创 大数据之------------数据中台

数据中台

2023-02-10 22:39:13 2760

原创 大数据-------元数据管理

大数据之元数据管理

2023-02-10 22:14:50 2572

原创 kafka不丢数据方案、数据重复处理、数据乱序问题处理

kafka不丢数据方案、数据重复处理、数据乱序问题处理

2022-12-11 15:07:58 2248

原创 Spark中宽依赖、窄依赖、Job执行流程

Spark中宽依赖、窄依赖、Job执行流程

2022-12-04 21:38:17 708

原创 Spark中RDD常见的算子:Value 类型、双 Value 类型、Key - Value 类型

Spark常见的算子

2022-12-03 15:45:02 1329

原创 Scala函数至简原则

scala函数至简原则

2022-11-28 23:49:04 562

原创 hive中连续N天登录问题、topN问题、拉链表实现

hive中连续N天登录、topN问题、拉链表

2022-11-25 16:47:59 3259

原创 Hive多行转多列,多列转多行

Hive多行转多列,多列转多行

2022-11-23 22:27:36 4881 1

原创 kafka tool数据乱码

kafkatool工具乱码

2022-11-17 18:29:45 2028

原创 数据同步工具DataX、Sqoop、Maxwell、Canal

数据同步工具DataX、Sqoop、Maxwell、Canal

2022-11-11 20:19:26 8197 1

原创 flink中的Time和watermark

flink中的Time和watermark

2022-11-07 20:36:55 618

原创 flink运行时组件和调度原理

flink运行时组件和调度原理

2022-11-06 20:08:49 743

原创 Spark基本架构和原理

spark架构和原理

2022-11-05 13:00:07 552

原创 Redis中缓存击穿,缓存穿透,缓存雪崩的原因和解决方案

redis缓存击穿、缓存穿透、缓存雪崩

2022-10-29 12:02:45 590

原创 Redis和MySQL数据库的一致性问题

redis和MySQL中数据一致性

2022-10-29 11:58:28 2117

原创 hive中的数据倾斜

hive中的数据倾斜

2022-10-27 13:15:27 917

原创 hive中函数的具体运用

hive函数运用

2022-10-27 11:28:35 644

原创 hive知识汇总

hive知识点汇总

2022-10-26 20:10:29 1498

原创 HadoopHA

HadoopHA

2022-10-24 18:47:34 95

原创 为什么Spark比Hadoop快

Spark为什么比Hadoop快

2022-10-23 17:33:26 768

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除