小学二年级都能玩大数据
文章平均质量分 56
PKQ1023
Limit
展开
-
决策树分类问题 scala代码实现
Spark2.0 决策树(C4.5) scala代码实现 maven依赖 <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-core_2.11</artifactId> <version>2.1.1</version> </dependency> <dependency> <gro原创 2021-04-23 11:59:04 · 773 阅读 · 3 评论 -
Hadoop之完全分布式集群(保姆级教程)
Hadoop之完全分布式集群(保姆级教程) 文章目录Hadoop之完全分布式集群(保姆级教程)环境介绍补充配置SSH免密登录配置文件配置hadoop-env.sh文件和yarn-env.sh文件配置core-site.xml文件配置hdfs-site.xml文件配置yarn-site.xml文件配置mapred-site.xml文件配置slaves文件复制两台虚拟机克隆后补充差异物理机的hosts文件也要建立映射关系与两台克隆机建立SSH连接格式化NameNode启动集群检验检验hdfs检验yarn 环境介原创 2020-10-08 20:31:31 · 201 阅读 · 0 评论 -
Hadoop之本地模式(保姆级教程)
hadoop之本地模式(保姆级教程) 环境介绍 虚拟机版本 → VMware Workstation16 PRO 镜像版本 → CentOS-7-x86_64-Minimal-2003 远程连接工具 → FinalShell 3.6.3 准备工作 ①防火墙&selinux #--> ①关闭防火墙 [root@localhost ~]# systemctl stop firewalld.service #--> ②设置防火墙开机不自启 [roo原创 2020-10-03 19:36:34 · 245 阅读 · 1 评论 -
在VMware中安装Centos7(保姆级教程)
在VMware中安装Centos7[保姆级教程]阅前须知〇在安装之前的准备①创建空虚拟机打开虚拟机进入 **"新建虚拟机向导"**进入 **"选择虚拟机硬件兼容性"**进入 **"安装客户机操作系统"**进入 **"选择客户机操作系统"**进入 **“命名虚拟机”**进入 **"处理器配置"**进入 **"此虚拟机的内存"**进入 **"网络类型"**进入 **"选择I/O控制器类型"**进入 **"选择磁盘类型"**进入 **"选择磁盘"**进入 **"指定磁盘容量"**进入 **"指定磁盘文件"**进入原创 2020-10-02 16:54:08 · 828 阅读 · 1 评论