
大数据实战
文章平均质量分 89
实战大数据过程记录
本自具足,莫向外求
不是热爱,长久不了
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
HBase和Kafka分布式集群的构建
在。原创 2025-09-11 20:28:12 · 1022 阅读 · 0 评论 -
用户行为数据可视化
进入网址:https://tomcat.apache.org/download-90.cgi,选择图示版本解压至windows本地文件夹即可。原创 2025-09-22 20:43:58 · 501 阅读 · 0 评论 -
基于Flink的用户行为实时分析
我将指导您完成Flink的安装、测试和WordCount程序的运行。原创 2025-09-20 16:44:18 · 802 阅读 · 0 评论 -
构建日志采集和分析平台(Flume+Hive)
1.8.0scphadoop01hadoop01seqmemoryloggerflume-ngagent-n agent-nagent-c conf-cconf-f执行命令后,Flume Agent 会启动并开始工作。这些就是loggerSink打印出的事件内容。body部分同时显示了字节序列(十六进制)和其对应的字符串格式。要停止 Flume Agent,只需在控制台按下Ctrl + C组合键即可。原创 2025-09-14 14:05:39 · 847 阅读 · 0 评论 -
基于Spark的用户实时分析
这样您就可以在 IDEA 中完整地开发、调试和运行 Spark 程序了!首先,我们需要下载 Spark 安装包。:点击绿色的运行按钮 ▶️。目录下会生成结果文件。原创 2025-09-17 20:34:49 · 595 阅读 · 0 评论 -
Zookeeper ,Hadoop,YARN分布式集群的构建以及调优
offset +0.097289 sec:表示同步前 hadoop02 的本地时间比 hadoop01 快了约 0.097 秒(即 97 毫秒),ntpdate 已自动修正这个微小偏差,让两台机器时间保持一致。这个偏移量(97 毫秒)非常小,属于正常范围,说明 hadoop02 与 hadoop01 的时间已实现有效同步。覆盖系统默认时区,确保集群节点时间标准统一为中国标准时间(若没安装,登录root用户,用。,实现集群节点间 SSH 免密登录。命令,看输出的时区标识(如。同步时间,保证集群时间一致。原创 2025-09-10 15:38:37 · 953 阅读 · 0 评论 -
ubuntu 18.04配置镜像源
配置镜像源的主要作用是优化软件下载速度、提升系统更新稳定性,并确保软件包获取的可靠性。并复制黏贴参考博文里的镜像内容,我的ubuntu是18.04,对应的镜像是。将里面原有的加#全部注释掉。我这里配置阿里云镜像源。以防万一,先备份一下。原创 2025-07-04 18:38:28 · 495 阅读 · 0 评论 -
设置linux静态IP,主机名与IP地址映射,创建 Linux 用户和用户组,SSH免密登录
方法一Ubuntu 18.04采用netplan来管理网络配置计划,在/etc/netplan/目录下有一个以yaml结尾的文件,例如00-installer-config.yaml,不同版本的系统这个文件名可能会有些差异,但是不影响,以实际为准。步骤1:先ifconfig查看电脑的网卡信息:找到物理网卡的名称,我这里是ens33,其他几个是虚拟网卡和本地回环,不用管。步骤2:输入route -n命令,打印路由表,这里主要是为了查看网关地址,后续会用到。原创 2025-07-01 21:15:59 · 1313 阅读 · 0 评论