yyds10011-CSDN博客

原创完全式分布

(Press y|Y for Yes, any other key for No) 表示是否拒绝 root 用户远程登录，在键盘输入 n 和回车，表示允许 root 用户远程登录。执行 mysql_secure_installation 命令初始化 MySQL 数据库，初始化过程中需要设定数据库 root 用户登录密码，密码需符合安全规则，包括大小写字符、数字和特殊符号，可设定密码为 Password123$。上述目录中/input 目录是输入数据存放的目录，/output 目录是输出数据存放的目录。

2024-04-28 14:25:56 1376

原创搭建单机版的hadoop ,spark和scala服务器

将 mapred-site.xml.template 复制一份为 mapred-site.xml，再配置 mapred-site.xml。export JAVA_HOME=/usr/local/src/jdk1.8.0_152 #指定jdk位置如没有需下载。使用source /etc/profile来更新启用scala。/hadoop/etc/hadoop #指定hadoop路径。编写/etc/profile在最下面添加如下路径。使用./bin/spark-shell 命令。检查 JAVA 是否可用。

2024-04-27 21:15:40 1974

原创零基础快速认识云三大数据

MapReduce是一种用于大规模数据处理的编程模型和算法。它最初由Google公司提出，并被用于处理大规模的Web搜索日志数据。后来，Apache Hadoop项目将MapReduce引入开源社区，并成为大数据处理的重要组成部分。MapReduce的设计目标是能够在分布式环境下高效地处理大规模数据集。它的核心思想是将数据处理任务分解为两个阶段：Map阶段和Reduce阶段。在Map阶段，数据被划分为一系列的键值对，然后分发给多个Map任务进行处理。

2024-03-07 17:39:17 1587 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 完全式分布

原创 搭建单机版的hadoop ,spark和scala服务器

原创 零基础快速认识云三大数据

空空如也

空空如也

原创完全式分布

原创搭建单机版的hadoop ,spark和scala服务器

原创零基础快速认识云三大数据