自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 Ambari一键搭建HDP大数据集群

bigdata1 | Master主节点 | CentOS7 Minimal | 16G | 500G | NameNode、RM、HMaster、ZK、Spark History || bigdata3 | Worker节点 | CentOS7 Minimal | 16G | 500G | DataNode、NM、HRegionServer、ZK || bigdata2 | 备份Master | CentOS7 Minimal | 16G | 500G | SecondaryNameNode |

2026-06-29 16:07:25 185

原创 一篇看懂Linux自动部署:PXE+Kickstart无人值守装机,机房批量装系统超简单

今天用最通俗的话,带你吃透Linux PXE自动部署+Kickstart无人值守,看完就能自己搭一套。如果你是初学者,建议先在VMware搭一套小实验,把流程跑通,再慢慢加图形菜单、自定义软件、YUM仓库这些增强功能。平时装系统:光盘/U盘 → 一台一台操作 → 重复点下一步、分区、设密码,机房50台电脑能累死人。让电脑在没系统、没硬盘的情况下,通过网卡直接从网络启动,相当于一个隐形启动U盘。一句话:PXE负责网络启动,Kickstart负责自动安装,一套搞定批量装机。

2026-05-28 11:30:46 208

原创 【大数据实战】Flume 原理详解 + 交互式模拟器

Apache Flume 是一个分布式、高可靠、高可用的日志采集与传输框架,专门用来把海量服务器日志、用户行为、业务数据,实时采集并传输到 HDFS、HBase、Kafka、Elasticsearch 等大数据存储系统。摘要:本文用通俗图解+可动手操作的Flume模拟器,带你从零掌握Flume核心架构、组件、工作流程,并提供可直接运行的仿真实验环境,适合学习、教学、面试快速复习。常见类型:HDFS Sink、HBase Sink、Logger Sink、Avro Sink。

2026-05-14 11:27:03 247

原创 大数据入门:Apache Hive 到底是什么?

Hive 擅长处理 PB 级超大规模数据,延迟偏高,适合离线分析、报表统计,以批量写入、多次查询为主,不适合高频实时修改,依靠分布式集群,扩展能力极强。MySQL 这类传统数据库,响应速度快,毫秒级别,适合网站、APP 后台,支持频繁增删改查,但数据到 TB 级别就很吃力。如果没有 Hive,你必须手写 MapReduce 代码,几百行逻辑,调试复杂,效率极低,只有专业开发才能搞定。这篇文章用最通俗的语言、真实场景和简单案例,带你一次性搞懂 Hive,全程无表格、无晦涩术语,新手也能轻松学会。

2026-04-23 20:28:58 266

原创 ZOOKEEPER分布式协调

Apache ZooKeeper是开源分布式协调服务,为Hadoop、HBase、微服务框架提供统一的配置管理、命名服务、集群管理、分布式锁与同步能力,保证分布式环境高可用+强一致。​- 广播模式:正常运行时,Leader原子广播事务,过半节点确认即提交,保证全局一致。- Leader:唯一处理写请求,发起投票、事务广播与提交,维护全局zxid。​- Observer:只同步数据、处理读请求,不参与投票,用于扩容读性能。​- Follower:处理读请求,转发写请求,参与选举与事务投票。

2026-04-11 16:13:33 238

原创 大数据分布式集群基础配置|核心内容总结

CentOS 7网卡配置路径: /etc/sysconfig/network-scripts/ifcfg-ens33 ,修改为静态IP、网关、DNS后重启网络。虚拟机支持桥接、NAT、仅主机三种模式。掌握集群基础配置内容、虚拟机上网模式、网络配置文件路径、关闭防火墙原因与方法、SSH协议及免密流程。在虚拟网络编辑器设置NAT子网、网关、DHCP地址段,集群节点统一规划静态IP,方便通信管理。使用完整克隆快速搭建多节点,克隆后必须修改IP、主机名、UUID、MAC,保证节点唯一。四、静态IP与网段规划。

2026-04-11 15:50:59 56

原创 大数据分布式集群搭建基础

SecureCRT是支持SSH2、SSH1、Telnet、Telnet/SSH、Relogin、Serial、TAPI、RAW等协议的终端仿真程序,本质是Windows下登录UNIX、Linux服务器主机的专用软件,支持标签化SSH对话,方便管理多个SSH连接。4. 数据目录规划:对Linux系统中的核心目录进行规划管理,核心涉及bin、boot、dev、etc、home、sbin、tmp、root、run、usr、var等系统目录,明确各目录在集群中的数据存储、程序运行等用途。

2026-04-04 01:30:39 1019

原创 【系统环境与基本命令】

Linux提供了很多种虚拟终端,使用ttyN表示,使用Ctrl+Alt+F[1-6]可以进行虚拟终端的切换,这些终端设备记录在/dev/目录下。man命令是Linux下的帮助指令,通过man指令可以查看Linux中的指令帮助、配置文件帮助和编程帮助等信息。9.1date命令的输出结果可以对当前时间的以传递的参数进行格式化。-n或-nodename  显示在网络上的主机名称。-r或--release  显示操作系统的发行编号。-s或--sysname  显示操作系统名称。-a或--all  显示全部的信息。

2026-03-19 15:40:24 208

原创 系统环境与基本命令

2026-03-19 11:38:07 36

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除