Hadoop
文章平均质量分 69
学习Hadoop
这孩子谁懂哈
坚持比努力更可怕/You Reap What You Sow
展开
-
Hadoop之VMware安装Centos 7(二)
一、准备工作 1、下载并安装 VMware(可参照以下链接)VMware安装 2、镜像下载地址 https://vault.centos.org/7.5.1804/isos/x86_64/CentOS-7-x86_64-DVD-2009.iso 二、创建虚拟机(硬件) 1、打开VMware,点击“创建新的虚拟机”; 2、选择典型安装,点击下一步;(典型创建步骤少,更适合新手,自定义安装自由度高,这里选择见仁见智,最终殊途同归) 3、选择稍后安装操作系统,点击下一步; 4、选择操作系统,点选.原创 2021-12-12 12:43:57 · 2983 阅读 · 0 评论 -
Hadoop之VMware安装指南(一)
01.Vmware的下载与安装 详细过程: 1.获取Vmware的安装包 进入官网下载:官网 等待下载即可:原创 2021-12-11 22:52:55 · 3961 阅读 · 0 评论 -
大白话讲解Spark中的RDD
资料中: Spark 中最基本的数据抽象是 RDD。 RDD:弹性分布式数据集 (Resilient Distributed DataSet)。 RDD的三个特性:分区,不可变,并行操作。 • RDD 是 Spark 的最基本抽象,是对分布式内存的抽象使用,实现了以操作本地集合的方式 来 操作分布式数据集的抽象实现 • RDD 是 Spark 最核心的东西,它表示已被分区,不可变的并能 够被并行操作的数据集合, 不同的数据集格式对应不同的 RDD 实现 RDD特点: • RDD 必须是可序列化的 •原创 2020-11-15 16:37:28 · 13370 阅读 · 1 评论 -
通俗易懂大数据生态
大数据本身是个很宽泛的概念,Hadoop生态圈(或者泛生态圈)基本上都是为了处理超过单机尺度的数据处理而诞生的。你可以把它比作一个厨房所以需要的各种工具。锅碗瓢盆,各有各的用处,互相之间又有重合。你可以用汤锅直接当碗吃饭喝汤,你可以用小刀或者刨子去皮。但是每个工具有自己的特性,虽然奇怪的组合也能工作,但是未必是最佳选择。 大数据,首先你要能存的下大数据。 传统的文件系统是单机的,不能横跨不同的机器。HDFS(Hadoop Distributed FileSystem)的设计本质上是为了大量的数据能...翻译 2020-11-11 13:09:23 · 13419 阅读 · 2 评论