自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(37)
  • 收藏
  • 关注

原创 python操作ES(pythonRestClient)

Elasticsearch 提供了官方的 Python 客户端库 elasticsearch-py,它是与 Elasticsearch 进行交互的主要工具。这个库允许你通过 Python 代码来执行 Elasticsearch 的各种操作,包括索引、搜索、更新和删除文档等。

2024-09-09 05:00:00 437

原创 cdh kafka告警打开文件描述数过多

File Descriptors 文件描述数打开过多

2023-10-09 23:04:35 339

原创 当zk某个节点坏掉如何修复

当发生zk数据文件丢失(误删或者磁盘损坏节点损坏都可能出现)时,cdh会出现如下告警。

2023-10-09 11:46:43 267

原创 NebulaGrap入门介绍和集群安装部署

​ NebulaGraph 一款开源、分布式图数据库,擅长处理超大规模数据集。Nebula Graph 采用存储计算分离架构,支持水平扩展,利用 RAFT 分布式 concensus 协议来实现金融级的高可用,类 SQL 查询语言降低了 SQL 程序员迁移成本。​ 特点:开源、分布式、易扩展、原生图数据库。能够承载包含数千亿个点和数万亿条边的超大规模数据集。提供毫秒级查询、类SQL​ 图数据库是专门存储庞大的图像网络并从中检索信息的数据库。

2023-09-08 13:50:52 478

原创 python节假日库holidays——查询国家节假日

查询国家节假日的python库

2023-09-01 14:19:05 4238

原创 两个hdfs之间迁移传输数据

主要解决hdfs跨集群复制/迁移问题。

2023-08-28 17:32:24 1610

原创 Hbase split Region

region split是hbases水平扩展一个重要因素。随着数据的不断写入,将一个region切分为两个小region,并将切分后的region放在不同的节点上,以达到将负载进行均衡到其他节点。随着数据不断插入表,region不断增大,当增大到一个阀值的时候,region就会等分会 两个新的region(裂变);

2023-07-21 16:09:34 875

原创 HBase Flush刷写时机条件和阻塞情况

数据从memstore 写到 storeFile的过程。当MemStore中的数据量达到阈值,就将数据Flush到HDFS中,以Storefile形式存储。

2023-07-19 17:06:33 570

原创 MongoDB三种集群模式

mongodb 三种集群模式

2023-07-11 13:39:59 509

原创 异构场景下DataNode的容量均衡

在DataNode磁盘异构差距较大,并且大量磁盘较小的DataNode剩余空间不足的情况下(例如剩余128M多一点)如何防止HDFS写数据失败

2023-07-06 11:02:48 417

原创 Hbase读写流程详解

hbase读写原理

2023-07-04 16:55:44 395

原创 Hbase各个组成部件的功能作用以及架构原理

hbase——海量数据查询

2023-07-04 16:07:01 557

原创 MongoDB安装+基础使用

mongodb是一个nosql数据库,它有高性能、无模式、文档型的特点。他是nosql数据库中功能最丰富,最像关系数据库的。一 mongoDb基本介绍mongodb里面有以下几个核心概念: 文档:mongodb数据库的最小数据集,是由多个键值对有序组合的数据单元,类似于mysql的数据记录; 集合:由一组文档构成,类似于mysql的表; 库:每个数据库都是独立的,有自己的用户,权限,独立存储集合,类似于mysql的库; 实例:系统

2023-07-03 18:01:26 429

原创 Kotlin基础学习

kotlin编程入门学习

2023-06-28 12:23:01 137

原创 ElasticSearch——分布式搜索和分析引擎

elasticsearch, elasticsearch,elasticsearch,elasticsearch,elasticsearch ,elasticsearch

2022-12-18 20:43:22 467 1

原创 大数据—运维—K8s—pod理论

云原生技术核心k8s目前已经逐渐成为计算机、云计算、大数据等行业技术的标杆和基础。令k8s目前也已经趋于成熟阶段,很多大厂小厂都用到这一技术内容。 在此和大家一同学习,本人也是首次学习该项技术,把笔记分享在这个方便大家交流学习。分享中如有写的合适的地方欢迎指正。k8s全称kubernetes,这个名字大家应该都不陌生,k8s是为容器服务而生的一个可移植容器的编排管理工具,越来越多的公司正在拥抱k8s,并且当前k8s已经主导了云业务流程,推动了微服务架构等热门技术的普及和落地,正在如火如荼的发展。

2022-12-04 16:55:48 1405

原创 Ceph原理学习介绍—>ceph入门

ceph理论,ceph入门技术讲解

2022-10-24 01:36:15 663

原创 hbase安装部署

hbase学习前的准备(hbase 安装部署)

2022-10-08 23:47:43 2123

原创 flink入门_flink简单学习_flink初识

flink入门学习flink 简单入手flink使用flink如何使用

2022-09-29 23:15:16 1148

原创 flink技术理论

flink

2022-09-17 15:06:10 719

原创 关于mysql多表关联查询的整理——大宁

mysql关于多表关联查询的整理。

2022-08-21 17:56:55 479

原创 scala答疑

关于scala编程的疑问,scala bug, scala理解 相关的解答。

2022-08-14 16:32:44 277

原创 flink安装部署

flink多种模式的安装部署

2022-08-10 10:06:42 2252

原创 linux上线安装特定版本的python

你是不是也在为python特定版本安装而烦恼过?python离线安装python特定版本安装

2022-08-08 16:31:46 1286 2

原创 flink原理及开发总结(详细)

目的是写一篇关于flink最详细最易懂的博文。

2022-07-23 12:40:16 634

原创 scala编程(中级进阶实验应用)

scala中级

2022-07-23 11:47:43 364

原创 scala编程(初级)

scala入门足够了

2022-07-23 11:28:13 1775

原创 CDH5、CDH6部署指南(稳)

cdh5,cdh6进行部署,非常详细,

2022-07-21 20:22:53 1105 1

原创 CDH新增机器节点

CDH5新增机器节点

2022-07-18 18:51:45 1091

原创 Kafka原理+操作+实战

kakfa原理,kafka机制,kafak使用,kafka api使用, Kafka原理+操作+实战+api

2022-07-14 00:01:42 2991 2

原创 Hadoop(hdfs, yarn, mapreduce)理论详解

hadoop,hdfs,yarn,mapreduce

2022-07-10 14:41:29 1816 1

原创 flink-cdc入门使用

flink-cdc入门,flink-cdc原理概述,flink-cdc简单应用

2022-07-07 08:45:33 2373

原创 大数据之Redis——redis基础操作

redis基础入门

2022-07-06 07:24:23 943

原创 redis部署锦集,redis部署都在这了。

redis是一个key-value存储系统。和Memcached类似,它支持存储的value类型相对更多,包括string(字符串)、list(链表)、set(集合)、zset(sorted set --有序集合)和hash(哈希类型)。这些数据类型都支持push/pop、add/remove及取交集并集和差集及更丰富的操作,而且这些操作都是原子性的。在此基础上,redis支持各种不同方式的排序。与memcached一样,为了保证效率,数据都是缓存在内存中。......

2022-07-05 21:53:51 3049 1

原创 大数据组件运维—kafka安装部署

大数据组件之kafka部署

2022-07-01 19:39:50 887

原创 对实时计算极短时间内同一对象连续过来多笔数据造成计算错误问题的解决方案

解决极短时间内,同一对象连续过来多笔数据造成计算错误问题。

2022-06-30 14:17:52 622 2

原创 Flink配置Yarn日志聚合、配置历史日志。

yarn容器退出之后,默认是不保存日志的。所以需要开启JobHistoryServer. 无论Flink还是Spark都支持自建集群(standalone cluster)。但是为了保证稳定性和资源隔离等,生产环境里的任务最好借助资源管理框架(如Yarn)运行。任务运行在yarn上,查询日志就可能不是很方便,尤其是任务进程异常退出之后。..................

2022-06-29 14:13:02 5722 8

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除