- 博客(5)
- 收藏
- 关注
原创 手把手教学伪分布式
2.Hadoop3.0以上版本的安装压缩包。hadoop -version 检查Hadoop是否配置成功。注意这里不能⽤root账号启动进程,需要在环境变量中配置。3.jdk1.8版本的环境安装包。将SELINUX属性的值改为disabled。# 刷新完 执行命令验证JDK是否安装成功。# 加入配置 加入位置如下图所示。指定解压在/opt目录下。# 保存后刷新环境变量。的VMware虚拟机。
2024-04-26 17:03:13 841 4
原创 Hive 组件安装配置
将/usr/local/src/hive/conf 文件夹下 hive-default.xml.template 文件,更名为 hive-site.xml。6 )将以下位置的 ${system:java.io.tmpdir}/${system:user.name} 替换为 “/usr/local/src/hive/tmp”目录及其子目录。(2)本地安装 MySQL 数据库(账号 root,密码 Password123$), 软件包在/opt/software/mysql-5.7.18 路径下。
2024-04-11 21:44:21 1985
原创 Hadoop不为人知的那点事
Hadoop是目前应用最为广泛的分布式大数据处理框架,其具备可靠、高效、可伸缩等特点。Hadoop的核心组件是、MapReduce。随着处理任务不同,各种组件相继出现,丰富Hadoop生态圈,目前生态圈结构大致如图所示:Hadoop生态圈相关组件包括以下4个基本模块。1) Hadoop基础功能库:支持其他Hadoop模块的通用程序包。2) HDFS: -个分布式文件系统,能够以高吞吐量访向应用中的数据。3) YARN: -个作业调度和资源管理框架。
2024-03-10 18:25:04 1891 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人