大数据_筑梦之路的博客-CSDN博客

大数据

关注

关注数：文章数：59 文章阅读量：55427 文章收藏量：286

作者: 筑梦之路

知识就是力量！

展开

kafka性能测试案例 —— 筑梦之路

以写入100w条MQ消息为例，每秒平均向kafka写入了4.77MB的数据，平均4999.725条消息/秒，每次写入的平均延迟为0.51毫秒，最大的延迟为481毫秒适当调大 batch.size和 linger.ms：这两个参数是配合起来使用的，目的就是缓存更多的数据，减少客户端发起请求的次数。这两个参数根据实际情况调整，注意要适量。关闭数据发送确认机制：适用于对数据完整性要求不高的场景，比如日志，丢几条无所谓那种。

原创 2024-07-22 15:18:12 · 595 阅读 · 0 评论
大数据运维学习笔记之hadoop跨集群数据迁移应用实战——筑梦之路

大数据运维学习笔记之Hadoop跨集群数据迁移、学习方法

原创 2024-07-11 22:44:00 · 264 阅读 · 0 评论
arm64架构下源码编译安装kafka —— 筑梦之路

一般来说，直接使用官方提供的二进制文件即可，没有必要使用源码编译安装的方式，而对于有特殊用途的，选择源码编译安装无疑是更好地选择。比如修改源码实现想要的功能，mirrormaker2保持topic名称不变。● 如果你对 Kafka 进行了自定义修改，确保这些修改不会破坏 Kafka 的核心功能。● 确保在编译和运行 Kafka 时使用与你的 Kafka 版本兼容的 Java 版本。● Kafka 的配置非常灵活，你可以根据需要调整 config/ 目录下的配置文件。

原创 2024-07-10 22:19:12 · 1058 阅读 · 0 评论
大数据运维学习笔记之大数据平台硬件规划、网络调优、架构设计、节点规划——筑梦之路

大数据平台资源规划

原创 2024-07-09 23:04:49 · 472 阅读 · 0 评论
大数据运维学习笔记之hadoop平台常见故障汇总和操作系统性能调优——筑梦之路

hadoop常见故障和性能调优

原创 2024-07-09 00:07:03 · 202 阅读 · 0 评论
hadoop集群常用命令搜集——筑梦之路

【代码】hadoop集群常用命令搜集——筑梦之路。

原创 2024-07-07 22:44:26 · 425 阅读 · 0 评论
比Elasticsearch更高效的开源搜索引擎Meilisearch——筑梦之路

例如，在官方提供的基准测试中，使用 Meilisearch 处理 10 万个文档时，平均搜索时间为 1.47 毫秒，而使用 Elasticsearch 搜索同样的数据集时，平均搜索时间为 44.1 毫秒。Meilisearch 的安装和设置过程非常简单，并且它提供了易于使用的 Web 界面和 CLI 工具，使用户可以轻松管理和监控搜索引擎。Meilisearch 的搜索和索引都是高度可定制的，包括自定义排名、字段权重和搜索范围等功能。支持多种设置和搜索参数，可适应不同的业务场景。

原创 2024-07-07 22:18:30 · 1495 阅读 · 0 评论
大数据运维学习笔记之Yarn\HDFS\kafka内存调优策略和性能瓶颈——筑梦之路

大数据运维学习笔记之Yarn\HDFS\kafka内存调优策略和性能瓶颈

原创 2024-07-07 01:42:36 · 172 阅读 · 0 评论
大数据运维学习笔记之HDFS存储权限ACL控制策略、系统权限整合应用——筑梦之路

大数据运维学习笔记hdfs权限控制策略ACL

原创 2024-07-04 23:33:13 · 234 阅读 · 0 评论
大数据运维学习笔记之kafka Eagle监控kafka消息队列——筑梦之路

大数据运维学习笔记之kafka eagel

原创 2024-06-27 23:17:00 · 332 阅读 · 0 评论
大数据运维学习笔记之namenode、datanode、nodemanager等服务状态监控策略 —— 筑梦之路

原创 2024-06-27 22:43:50 · 170 阅读 · 0 评论
大数据运维学习笔记之Ganglia监控HDFS、Yarn、Spark运行状态 —— 筑梦之路

大数据运维学习笔记之ganglia监控

原创 2024-06-25 00:06:41 · 165 阅读 · 0 评论
大数据运维学习笔记之构建可视化日志系统ELFK——筑梦之路

大数据运维学习笔记之可视化日志系统

原创 2024-06-23 23:26:44 · 149 阅读 · 0 评论
大数据运维学习笔记之filebeat+kafka+MM1跨机房实时日志传输案例——筑梦之路

大数据运维学习笔记之kafka镜像同步案例

原创 2024-06-22 22:48:46 · 383 阅读 · 1 评论
大数据运维学习笔记之kafka —— 筑梦之路

大数据运维学习笔记之kafka

原创 2024-06-22 22:11:30 · 217 阅读 · 1 评论
大数据运维学习笔记之ES应用架构与调优——筑梦之路

大数据运维学习笔记之elasticsearch

原创 2024-06-20 00:20:08 · 167 阅读 · 0 评论
大数据运维学习笔记之logstash日志搜集分析过滤——筑梦之路

大数据运维学习笔记之logstash

原创 2024-06-17 22:55:40 · 218 阅读 · 0 评论
大数据运维学习笔记之轻量级日志搜集filebeat——筑梦之路

大数据之filebeat日志搜集工具

原创 2024-06-12 21:28:23 · 156 阅读 · 0 评论
大数据运维学习笔记之flink standalone flink on yarn集群搭建 —— 筑梦之路

大数据运维学习笔记之flink standalone flink on yarn集群搭建

原创 2024-06-10 23:04:03 · 384 阅读 · 2 评论
大数据运维学习笔记之hbase和Hadoop整合——筑梦之路

大数据运维学习笔记之hbase hadoop整合

原创 2024-06-10 00:09:56 · 226 阅读 · 1 评论
kafka集群内外网分流方案——筑梦之路

在现代分布式系统架构中，Kafka作为一款高性能的消息队列系统，广泛应用于大数据处理、实时流处理以及微服务间的异步通信场景。特别是往往企业级应用中，业务网段和内网通信网段不是同一个网段，内网的机器想要访问业务数据只能基于现有业务网卡的机器才能访问，此时想要kafka集群内外网都可以通信，即内网的走内网IP，外网的走外网ip，互不影响，同时，也要确保集群内部通信高效、安全，充分利用内网资源，避免不必要的外网流量消耗。

原创 2024-06-03 21:58:16 · 884 阅读 · 1 评论
大数据运维学习笔记之spark standalone模式构建、与yarn整合——筑梦之路

大数据运维学习笔记之spark独立模式和yarn资源管理器整合

原创 2024-06-01 22:39:20 · 152 阅读 · 0 评论
大数据运维学习笔记之yarn、MR运行机制 —— 筑梦之路

大数据运维学习笔记之yarn资源管理器

原创 2024-05-29 23:50:00 · 174 阅读 · 0 评论
ELK搜集MySql慢日志 —— 筑梦之路

elk日志分析

原创 2024-05-28 22:11:43 · 379 阅读 · 0 评论
大数据运维学习笔记之HDFS运行机制和HDFS shell使用 —— 筑梦之路

HDFS运行机制和HDFS shell使用

原创 2024-05-27 23:34:04 · 321 阅读 · 0 评论
rocketmq跨版本升级方案参考—— 筑梦之路

rocketmq跨版本升级方案参考

原创 2024-05-27 21:15:12 · 492 阅读 · 0 评论
大数据运维学习笔记之hivetz —— 筑梦之路

大数据运维学习笔记之hive

原创 2024-05-26 23:41:27 · 238 阅读 · 0 评论
大数据运维学习笔记之ambari安装hbase\hive —— 筑梦之路

ambari搭建大数据平台、服务管理、配置管理、监控告警

原创 2024-05-26 00:28:19 · 353 阅读 · 0 评论
kafka跨地区跨集群同步工具MirrorMaker2 —— 筑梦之路

有四种运行MM2的方法：As a dedicated MirrorMaker cluster.（作为专用的MirrorMaker群集）As a Connector in a distributed Connect cluster.（作为分布式Connect群集中的连接器）As a standalone Connect worker.（作为独立的Connect工作者）

原创 2024-05-25 16:50:30 · 2022 阅读 · 0 评论
大数据运维学习笔记之Ambari——筑梦之路

ambari搭建大数据平台

原创 2024-05-23 22:45:06 · 459 阅读 · 0 评论
大数据运维学习笔记之搭建大数据平台2 —— 筑梦之路

大数据运维学习笔记之搭建大数据平台，手动方式

原创 2024-05-22 22:09:36 · 184 阅读 · 0 评论
ES性能压测工具esrally —— 筑梦之路

压测，即压力测试，是指对计算机系统、软件应用或网络服务等进行负载测试，以模拟实际使用场景中的高负载情况，检验系统在压力下的性能、稳定性和可靠性。压测旨在确定系统在正常或极端负载下的性能极限，以便在生产环境中提供最佳的性能和可靠性。

原创 2024-05-22 14:15:35 · 1584 阅读 · 0 评论
kafka调优参考建议 —— 筑梦之路

这里主要是从不同使用场景来调优，仅供参考。

原创 2024-05-21 10:23:45 · 2203 阅读 · 0 评论
kafka监控配置和告警配置——筑梦之路

kafka_exporter项目地址：https://github.com/danielqsj/kafka_exporter。

原创 2024-05-21 10:06:26 · 722 阅读 · 0 评论
大数据运维学习笔记之搭建大数据平台——筑梦之路

搭建企业级大数据平台

原创 2024-05-20 20:45:51 · 285 阅读 · 0 评论
大数据运维学习笔记之自动化运维工具——筑梦之路

自动化运维工具，这里主要是ansible相关知识的整理

原创 2024-05-19 22:47:31 · 233 阅读 · 0 评论
大数据运维学习笔记之如何选择发行版和伪分布式集群搭建 —— 筑梦之路

发行版选择和伪分布式集群搭建介绍

原创 2024-05-19 18:22:22 · 143 阅读 · 0 评论
大数据运维学习笔记之Hadoop生态圈—— 筑梦之路

hadoop生态圈

原创 2024-05-19 17:04:32 · 208 阅读 · 0 评论
ES集群性能优化参考建议——筑梦之路

ES集群调优参考建议Elasticsearch使用方式调优本文摘自一次看完28个关于ES的性能调优技巧，感谢大佬的分享，向大佬学习。

原创 2024-05-18 15:00:10 · 356 阅读 · 0 评论
kafka集群跨区域跨集群同步方案MirrorMaker1 —— 筑梦之路

acks 指定在集群中有多少个分区副本收到消息，生产者才会认为消息写入成功，对于消息是否丢失有比较大的影响，有3个值可选，0 1 all , 其中0 、1都可能会丢失数据，all安全性最高，效率最低，2个以上分区副本时不丢失任何数据。auto.offset.reset 消费者在无效偏移量、没有偏移量的情况下如何处理，默认是latest，从最新记录读取，容易丢失数据，这里设置为从头开始，避免丢失数据。max.poll.interval.ms 消费者处理逻辑的最大时间。下面介绍一则实战案例。

原创 2024-05-17 23:00:55 · 1307 阅读 · 0 评论

大数据

作者: 筑梦之路

kafka性能测试案例 —— 筑梦之路

大数据运维学习笔记之hadoop跨集群数据迁移应用实战——筑梦之路

arm64架构下源码编译安装kafka —— 筑梦之路

大数据运维学习笔记之大数据平台硬件规划、网络调优、架构设计、节点规划——筑梦之路

大数据运维学习笔记之hadoop平台常见故障汇总和操作系统性能调优——筑梦之路

hadoop集群常用命令搜集——筑梦之路

比Elasticsearch更高效的开源搜索引擎Meilisearch——筑梦之路

大数据运维学习笔记之Yarn\HDFS\kafka内存调优策略和性能瓶颈——筑梦之路

大数据运维学习笔记之HDFS存储权限ACL控制策略、系统权限整合应用——筑梦之路

大数据运维学习笔记之kafka Eagle监控kafka消息队列——筑梦之路

大数据运维学习笔记之namenode、datanode、nodemanager等服务状态监控策略 —— 筑梦之路

大数据运维学习笔记之Ganglia监控HDFS、Yarn、Spark运行状态 —— 筑梦之路

大数据运维学习笔记之构建可视化日志系统ELFK——筑梦之路

大数据运维学习笔记之filebeat+kafka+MM1跨机房实时日志传输案例——筑梦之路

大数据运维学习笔记之kafka —— 筑梦之路

大数据运维学习笔记之ES应用架构与调优——筑梦之路

大数据运维学习笔记之logstash日志搜集分析过滤——筑梦之路

大数据运维学习笔记之轻量级日志搜集filebeat——筑梦之路

大数据运维学习笔记之flink standalone flink on yarn集群搭建 —— 筑梦之路

大数据运维学习笔记之hbase和Hadoop整合——筑梦之路

kafka集群内外网分流方案——筑梦之路

大数据运维学习笔记之spark standalone模式构建、与yarn整合——筑梦之路

大数据运维学习笔记之yarn、MR运行机制 —— 筑梦之路

ELK搜集MySql慢日志 —— 筑梦之路

大数据运维学习笔记之HDFS运行机制和HDFS shell使用 —— 筑梦之路

rocketmq跨版本升级方案参考—— 筑梦之路

大数据运维学习笔记之hivetz —— 筑梦之路

大数据运维学习笔记之ambari安装hbase\hive —— 筑梦之路

kafka跨地区跨集群同步工具MirrorMaker2 —— 筑梦之路

大数据运维学习笔记之Ambari——筑梦之路

大数据运维学习笔记之搭建大数据平台2 —— 筑梦之路

ES性能压测工具esrally —— 筑梦之路

kafka调优参考建议 —— 筑梦之路

kafka监控配置和告警配置——筑梦之路

大数据运维学习笔记之搭建大数据平台——筑梦之路

大数据运维学习笔记之自动化运维工具——筑梦之路

大数据运维学习笔记之如何选择发行版和伪分布式集群搭建 —— 筑梦之路

大数据运维学习笔记之Hadoop生态圈—— 筑梦之路

ES集群性能优化参考建议——筑梦之路

kafka集群跨区域跨集群同步方案MirrorMaker1 —— 筑梦之路