大宁哥BigData-CSDN博客

原创 python操作ES（pythonRestClient）

Elasticsearch 提供了官方的 Python 客户端库 elasticsearch-py，它是与 Elasticsearch 进行交互的主要工具。这个库允许你通过 Python 代码来执行 Elasticsearch 的各种操作，包括索引、搜索、更新和删除文档等。

2024-09-09 05:00:00 889

原创 cdh kafka告警打开文件描述数过多

File Descriptors 文件描述数打开过多

2023-10-09 23:04:35 550

原创当zk某个节点坏掉如何修复

当发生zk数据文件丢失(误删或者磁盘损坏节点损坏都可能出现)时，cdh会出现如下告警。

2023-10-09 11:46:43 444

NebulaGraph 一款开源、分布式图数据库，擅长处理超大规模数据集。Nebula Graph 采用存储计算分离架构，支持水平扩展，利用 RAFT 分布式 concensus 协议来实现金融级的高可用，类 SQL 查询语言降低了 SQL 程序员迁移成本。特点：开源、分布式、易扩展、原生图数据库。能够承载包含数千亿个点和数万亿条边的超大规模数据集。提供毫秒级查询、类SQL 图数据库是专门存储庞大的图像网络并从中检索信息的数据库。

2023-09-08 13:50:52 688

原创 python节假日库holidays——查询国家节假日

查询国家节假日的python库

2023-09-01 14:19:05 6032

原创两个hdfs之间迁移传输数据

主要解决hdfs跨集群复制/迁移问题。

2023-08-28 17:32:24 2557

原创 Hbase split Region

region split是hbases水平扩展一个重要因素。随着数据的不断写入，将一个region切分为两个小region，并将切分后的region放在不同的节点上，以达到将负载进行均衡到其他节点。随着数据不断插入表，region不断增大，当增大到一个阀值的时候，region就会等分会两个新的region（裂变）；

2023-07-21 16:09:34 1100

原创 HBase Flush刷写时机条件和阻塞情况

数据从memstore 写到 storeFile的过程。当MemStore中的数据量达到阈值，就将数据Flush到HDFS中，以Storefile形式存储。

2023-07-19 17:06:33 874

原创 MongoDB三种集群模式

mongodb 三种集群模式

2023-07-11 13:39:59 686

原创异构场景下DataNode的容量均衡

在DataNode磁盘异构差距较大，并且大量磁盘较小的DataNode剩余空间不足的情况下（例如剩余128M多一点）如何防止HDFS写数据失败

2023-07-06 11:02:48 673

原创 Hbase读写流程详解

hbase读写原理

2023-07-04 16:55:44 597

原创 Hbase各个组成部件的功能作用以及架构原理

hbase——海量数据查询

2023-07-04 16:07:01 812

原创 MongoDB安装+基础使用

mongodb是一个nosql数据库，它有高性能、无模式、文档型的特点。他是nosql数据库中功能最丰富，最像关系数据库的。一 mongoDb基本介绍mongodb里面有以下几个核心概念：文档：mongodb数据库的最小数据集，是由多个键值对有序组合的数据单元，类似于mysql的数据记录；集合：由一组文档构成，类似于mysql的表；库：每个数据库都是独立的，有自己的用户，权限，独立存储集合，类似于mysql的库；实例：系统

2023-07-03 18:01:26 581

原创 Kotlin基础学习

kotlin编程入门学习

2023-06-28 12:23:01 226

原创 ElasticSearch——分布式搜索和分析引擎

elasticsearch， elasticsearch，elasticsearch，elasticsearch，elasticsearch ，elasticsearch

2022-12-18 20:43:22 566

原创大数据—运维—K8s—pod理论

云原生技术核心k8s目前已经逐渐成为计算机、云计算、大数据等行业技术的标杆和基础。令k8s目前也已经趋于成熟阶段，很多大厂小厂都用到这一技术内容。在此和大家一同学习，本人也是首次学习该项技术，把笔记分享在这个方便大家交流学习。分享中如有写的合适的地方欢迎指正。k8s全称kubernetes，这个名字大家应该都不陌生，k8s是为容器服务而生的一个可移植容器的编排管理工具，越来越多的公司正在拥抱k8s，并且当前k8s已经主导了云业务流程，推动了微服务架构等热门技术的普及和落地，正在如火如荼的发展。

2022-12-04 16:55:48 1590

原创 Ceph原理学习介绍—＞ceph入门

ceph理论，ceph入门技术讲解

2022-10-24 01:36:15 906

原创 hbase安装部署

hbase学习前的准备(hbase 安装部署)

2022-10-08 23:47:43 2239

原创 flink入门_flink简单学习_flink初识

flink入门学习flink 简单入手flink使用flink如何使用

2022-09-29 23:15:16 1302

原创 flink技术理论

flink

2022-09-17 15:06:10 791

原创关于mysql多表关联查询的整理——大宁

mysql关于多表关联查询的整理。

2022-08-21 17:56:55 576

原创 scala答疑

关于scala编程的疑问，scala bug， scala理解相关的解答。

2022-08-14 16:32:44 379

原创 flink安装部署

flink多种模式的安装部署

2022-08-10 10:06:42 2707

原创 linux上线安装特定版本的python

你是不是也在为python特定版本安装而烦恼过？python离线安装python特定版本安装

2022-08-08 16:31:46 1478 2

原创 flink原理及开发总结(详细)

目的是写一篇关于flink最详细最易懂的博文。

2022-07-23 12:40:16 703

原创 scala编程(中级进阶实验应用)

scala中级

2022-07-23 11:47:43 457

原创 scala编程(初级)

scala入门足够了

2022-07-23 11:28:13 1942

原创 CDH5、CDH6部署指南(稳)

cdh5,cdh6进行部署，非常详细，

2022-07-21 20:22:53 1233 1

原创 CDH新增机器节点

CDH5新增机器节点

2022-07-18 18:51:45 1275

原创 Kafka原理+操作+实战

kakfa原理，kafka机制，kafak使用，kafka api使用, Kafka原理+操作+实战+api

2022-07-14 00:01:42 3323 2

原创 Hadoop(hdfs, yarn, mapreduce)理论详解

hadoop,hdfs,yarn,mapreduce

2022-07-10 14:41:29 2104 1

原创 flink-cdc入门使用

flink-cdc入门，flink-cdc原理概述，flink-cdc简单应用

2022-07-07 08:45:33 2619

原创大数据之Redis——redis基础操作

redis基础入门

2022-07-06 07:24:23 1040

原创 redis部署锦集，redis部署都在这了。

redis是一个key-value存储系统。和Memcached类似，它支持存储的value类型相对更多，包括string(字符串)、list(链表)、set(集合)、zset(sorted set --有序集合)和hash（哈希类型）。这些数据类型都支持push/pop、add/remove及取交集并集和差集及更丰富的操作，而且这些操作都是原子性的。在此基础上，redis支持各种不同方式的排序。与memcached一样，为了保证效率，数据都是缓存在内存中。......

2022-07-05 21:53:51 3258 1

原创大数据组件运维—kafka安装部署

大数据组件之kafka部署

2022-07-01 19:39:50 1063

原创对实时计算极短时间内同一对象连续过来多笔数据造成计算错误问题的解决方案

解决极短时间内，同一对象连续过来多笔数据造成计算错误问题。

2022-06-30 14:17:52 735 2

原创 Flink配置Yarn日志聚合、配置历史日志。

yarn容器退出之后，默认是不保存日志的。所以需要开启JobHistoryServer. 无论Flink还是Spark都支持自建集群(standalone cluster)。但是为了保证稳定性和资源隔离等，生产环境里的任务最好借助资源管理框架(如Yarn)运行。任务运行在yarn上，查询日志就可能不是很方便，尤其是任务进程异常退出之后。..................

2022-06-29 14:13:02 6802 8

myself_ning的博客