大数据
爱做梦的锤子
主要专注于大数据应用领域,擅长语言Java和scala,欢迎访问我的个站:http://te-amo.site ,个人公众号【爱做梦的锤子】,知乎/微博 同id,平时喜欢拍照,在上面也会分享我的照片
展开
-
一起学习Spark——RDD进阶
本篇内容我们将更加深入的了解RDD,在本篇中我们将学习RDD的分区、缓存和Checkpoint,通过本篇学习让大家对RDD有更深的了解,同时在工作中可以更好使用RDD的相关功能原创 2020-09-17 22:22:31 · 282 阅读 · 0 评论 -
一起学习Spark——Action算子
本篇文章和大家一起学习Spark RDD的常用Action算子,会对每个算子含义和入参进行说明,并附上演示代码,帮助大家快速理解和使用这些常用算子原创 2020-08-26 22:52:07 · 942 阅读 · 0 评论 -
一起学习Spark——Transformation算子
本篇文章锤子和大家一起学习Spark RDD的常用Transformation算子,在文章中把转换算子分为了六大类:转换操作、过滤操作、集合操作、排序操作、聚合操作、分区操作,锤子会对每个算子含义和入参进行说明,并附上演示代码,帮助大家快速理解和使用这些常用算子原创 2020-08-22 17:01:22 · 511 阅读 · 1 评论 -
一起学习Spark——RDD入门
本篇文章是对RDD的简单介绍,希望通过阅读本文你可以对RDD有一个初步认识和了解,帮助你在Spark的后续学习中更加轻松原创 2020-08-21 21:58:27 · 454 阅读 · 1 评论 -
一起学习Spark入门
本篇文章是一个Spark入门文章,在文章中首先会对Spark进行简单概述,帮助大家先认识Spark,然后会介绍Spark安装部署上的基础知识,随后我们再演示几个简单案例帮助大家入门Spark,整篇文章所介绍的都是入门知识,更加适合没有接触过Spark刚开始学习时参考原创 2020-08-19 09:43:20 · 244 阅读 · 0 评论 -
Hive知识梳理
以问题作为引导,进行Hive知识梳理,可以复习知识时,可以快速抓住要点原创 2020-08-09 15:04:44 · 311 阅读 · 1 评论 -
一起学习Hive基础(多知识点)
本文是Hive学习的基础篇,包含Hive的部分基础理论知识如:hive介绍,Hive应用场景,Hive的文件存储方式,Hive的基本操作,Hive的表类型,Hive中数据分区,以及Hive的自定义函数等原创 2020-07-31 12:50:56 · 550 阅读 · 1 评论 -
Hadoop高可用安装(HA)
介绍了Hadoop分布式高可用安装原创 2020-07-27 20:22:19 · 292 阅读 · 0 评论 -
Elasticsearch基础——概念和基本API操作
基于Elasticsearch 7.1对其中的基本概念进行介绍,同时也介绍了es操作的基本api,学习组件基础知识原创 2020-06-16 19:27:13 · 1350 阅读 · 0 评论 -
认识Elasticsearch
学习组件前的基本了解原创 2020-06-12 16:31:32 · 1100 阅读 · 0 评论 -
学习必备——HBase和Zookeeper安装
学习必备文档,单机版HBase和Zookeeper安装原创 2020-06-10 17:57:10 · 1109 阅读 · 0 评论 -
HDFS进阶——文件存储和读写流程
学完了HDFS基础后,你是否有了这些疑问,上传到HDFS的文件存在哪里吗?文件是怎么上传上去的?我们读取文件的时候,HDFS又是怎么操作的呢?看完本篇或许你就有一个更清晰的认识了原创 2020-06-08 11:20:18 · 1825 阅读 · 0 评论 -
分布式文件系统HDFS——基础篇
学习Hadoop的核心组件HDFS——分布式文件系统,本文主要对HDFS的基础知识进行了讲解和介绍原创 2020-06-05 16:33:21 · 1778 阅读 · 0 评论 -
向Hadoop Say Hello——初识Hadoop
对Hadoop Say Hello,认识Hadoop,带你步入大数据的“不归路”原创 2020-05-28 09:45:38 · 1049 阅读 · 0 评论 -
教你安装单机版Hadoop,初学必备
Centos系统下安装单机版Hadoop,大数据学习必备,快来看看!原创 2020-05-26 16:46:37 · 1076 阅读 · 0 评论