- 博客(37)
- 收藏
- 关注
原创 python操作ES(pythonRestClient)
Elasticsearch 提供了官方的 Python 客户端库 elasticsearch-py,它是与 Elasticsearch 进行交互的主要工具。这个库允许你通过 Python 代码来执行 Elasticsearch 的各种操作,包括索引、搜索、更新和删除文档等。
2024-09-09 05:00:00 437
原创 NebulaGrap入门介绍和集群安装部署
NebulaGraph 一款开源、分布式图数据库,擅长处理超大规模数据集。Nebula Graph 采用存储计算分离架构,支持水平扩展,利用 RAFT 分布式 concensus 协议来实现金融级的高可用,类 SQL 查询语言降低了 SQL 程序员迁移成本。 特点:开源、分布式、易扩展、原生图数据库。能够承载包含数千亿个点和数万亿条边的超大规模数据集。提供毫秒级查询、类SQL 图数据库是专门存储庞大的图像网络并从中检索信息的数据库。
2023-09-08 13:50:52 478
原创 Hbase split Region
region split是hbases水平扩展一个重要因素。随着数据的不断写入,将一个region切分为两个小region,并将切分后的region放在不同的节点上,以达到将负载进行均衡到其他节点。随着数据不断插入表,region不断增大,当增大到一个阀值的时候,region就会等分会 两个新的region(裂变);
2023-07-21 16:09:34 875
原创 HBase Flush刷写时机条件和阻塞情况
数据从memstore 写到 storeFile的过程。当MemStore中的数据量达到阈值,就将数据Flush到HDFS中,以Storefile形式存储。
2023-07-19 17:06:33 570
原创 异构场景下DataNode的容量均衡
在DataNode磁盘异构差距较大,并且大量磁盘较小的DataNode剩余空间不足的情况下(例如剩余128M多一点)如何防止HDFS写数据失败
2023-07-06 11:02:48 417
原创 MongoDB安装+基础使用
mongodb是一个nosql数据库,它有高性能、无模式、文档型的特点。他是nosql数据库中功能最丰富,最像关系数据库的。一 mongoDb基本介绍mongodb里面有以下几个核心概念: 文档:mongodb数据库的最小数据集,是由多个键值对有序组合的数据单元,类似于mysql的数据记录; 集合:由一组文档构成,类似于mysql的表; 库:每个数据库都是独立的,有自己的用户,权限,独立存储集合,类似于mysql的库; 实例:系统
2023-07-03 18:01:26 429
原创 ElasticSearch——分布式搜索和分析引擎
elasticsearch, elasticsearch,elasticsearch,elasticsearch,elasticsearch ,elasticsearch
2022-12-18 20:43:22 467 1
原创 大数据—运维—K8s—pod理论
云原生技术核心k8s目前已经逐渐成为计算机、云计算、大数据等行业技术的标杆和基础。令k8s目前也已经趋于成熟阶段,很多大厂小厂都用到这一技术内容。 在此和大家一同学习,本人也是首次学习该项技术,把笔记分享在这个方便大家交流学习。分享中如有写的合适的地方欢迎指正。k8s全称kubernetes,这个名字大家应该都不陌生,k8s是为容器服务而生的一个可移植容器的编排管理工具,越来越多的公司正在拥抱k8s,并且当前k8s已经主导了云业务流程,推动了微服务架构等热门技术的普及和落地,正在如火如荼的发展。
2022-12-04 16:55:48 1405
原创 redis部署锦集,redis部署都在这了。
redis是一个key-value存储系统。和Memcached类似,它支持存储的value类型相对更多,包括string(字符串)、list(链表)、set(集合)、zset(sorted set --有序集合)和hash(哈希类型)。这些数据类型都支持push/pop、add/remove及取交集并集和差集及更丰富的操作,而且这些操作都是原子性的。在此基础上,redis支持各种不同方式的排序。与memcached一样,为了保证效率,数据都是缓存在内存中。......
2022-07-05 21:53:51 3049 1
原创 Flink配置Yarn日志聚合、配置历史日志。
yarn容器退出之后,默认是不保存日志的。所以需要开启JobHistoryServer. 无论Flink还是Spark都支持自建集群(standalone cluster)。但是为了保证稳定性和资源隔离等,生产环境里的任务最好借助资源管理框架(如Yarn)运行。任务运行在yarn上,查询日志就可能不是很方便,尤其是任务进程异常退出之后。..................
2022-06-29 14:13:02 5722 8
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人