- 博客(3)
- 收藏
- 关注
原创 完全式分布
(Press y|Y for Yes, any other key for No) 表示是否拒绝 root 用户远程登录,在键盘输入 n 和回车,表示允许 root 用户远程登录。执行 mysql_secure_installation 命令初始化 MySQL 数据库,初始化过程中需要设定 数据库 root 用户登录密码,密码需符合安全规则,包括大小写字符、数字和特殊符号, 可设定密码为 Password123$。上述目录中/input 目录是输入数据存放的目录,/output 目录是输出数据存放的目录。
2024-04-28 14:25:56
1376
原创 搭建单机版的hadoop ,spark和scala服务器
将 mapred-site.xml.template 复制一份为 mapred-site.xml,再配置 mapred-site.xml。export JAVA_HOME=/usr/local/src/jdk1.8.0_152 #指定jdk位置如没有需下载。使用source /etc/profile来更新启用scala。/hadoop/etc/hadoop #指定hadoop路径。编写/etc/profile在最下面添加如下路径。使用./bin/spark-shell 命令。检查 JAVA 是否可用。
2024-04-27 21:15:40
1974
原创 零基础快速认识云三大数据
MapReduce是一种用于大规模数据处理的编程模型和算法。它最初由Google公司提出,并被用于处理大规模的Web搜索日志数据。后来,Apache Hadoop项目将MapReduce引入开源社区,并成为大数据处理的重要组成部分。MapReduce的设计目标是能够在分布式环境下高效地处理大规模数据集。它的核心思想是将数据处理任务分解为两个阶段:Map阶段和Reduce阶段。在Map阶段,数据被划分为一系列的键值对,然后分发给多个Map任务进行处理。
2024-03-07 17:39:17
1587
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人