![](https://img-blog.csdnimg.cn/20200521124412555.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
大数据
大数据技术相关的文章
西门催学不吹雪
试试就能行,争争就能赢
展开
-
HBase 教程(超详细)
文章目录1. HBase 简介2. HBase 安装2.1 下载地址2.2 HBase 安装流程1. HBase 简介2. HBase 安装2.1 下载地址2.2 HBase 安装流程启动 Hadoop 集群启动 Zookeeper将 HBase 的安装包上传到服务器上(hbase-2.2.2-bin.tar.gz)解压 HBase 到指定目录tar -zxvf hbase-2.2.2-bin.tar.gz -C /hadoop/修改 HBase 的配置文件(/hadoop/h原创 2020-06-21 18:18:13 · 27456 阅读 · 4 评论 -
Hive 教程(一)—— Hive 介绍及安装
文章目录1. Hive 入门1.1 什么是 Hive1.2 Hive 的优缺点1.3 Hive 架构原理2. Hive 安装2.1 下载地址2.2 Hive 安装部署1. Hive 入门1.1 什么是 Hive Hive:由 Facebook 开源用于解决海量结构化日志的数据统计,现已归于 Apache。 Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类 SQL 查询功能。 本质是:将 HQL 转化成 MapReduce 程序。Hive原创 2020-06-03 11:39:14 · 1163 阅读 · 1 评论 -
Spark 教程(一)—— 基础解析(超详细)
文章目录1. Spark 概述1.1 什么是 Spark1.2 Spark 内置模块1.3 Spark 特点1.4 Spark 的重要角色1.4.1 Driver(驱动器)1.4.2 Executor(执行器)1.5 Spark 官网2. Spark 运行模式2.1 Local 模式2.1.1 概述2.1.2 安装使用2.1.3 官方求 PI 案例2.1.4 WordCount 案例2.2 Standalone 模式2.2.1 概述2.2.2 安装使用1. Spark 概述1.1 什么是 Spark原创 2020-05-25 23:59:34 · 3390 阅读 · 0 评论 -
MapReduce 三个经典案例(倒排索引、TopN、找共同好友)
文章目录1. 倒排索引案例1.1 需求1.2 需求分析1.3 代码实现1.3.1 第一次处理1.3.2 第二次处理2. TopN 案例2.1 需求2.2 代码实现3. 找共同好友案例3.1 需求3.2 需求分析3.3 代码实现3.3.1 第一次处理3.3.2 第二次处理1. 倒排索引案例1.1 需求 有大量的文本(文档、网页),需要建立搜索索引。输入数据① a.txtatguigu pingpingatguigu ssatguigu ss ② b.txtatguigu原创 2020-05-22 14:08:40 · 2564 阅读 · 0 评论 -
Zookeeper 教程(超详细)
文章目录1. Zookeeper 入门1.1 概述1.2 特点1.3 数据结构1.4 应用场景2. Zookeeper 安装2.1 下载地址2.2 本地模式安装部署2.3 分布式安装部署2.4 配置参数解读3. Zookeeper 内部原理3.1 选举机制3.2 节点类型3.3 Stat 结构体3.4 监听器原理3.5 写数据流程4. Zookeeper 实战4.1 客户端命令行操作4.2 API 操作4.3.1 IDEA 环境搭建4.3.2 创建 ZooKeeper 客户端4.3.3 创建子节点4.3.原创 2020-05-21 12:10:47 · 12046 阅读 · 3 评论 -
Hadoop 入门教程(超详细)
文章目录1. Hadoop 框架1.1 Hadoop 介绍1.1.1 Hadoop 是什么1.1.2 Hadoop 的发展历史1.1.3 Hadoop 三大发行版本1.1.4 Hadoop 的优势1.1.5 Hadoop 的组成1. Hadoop 框架1.1 Hadoop 介绍1.1.1 Hadoop 是什么Hadoop 是一个由 Apache 基金会所开发的分布式系统基础架构。主要...原创 2020-04-18 23:49:52 · 82059 阅读 · 11 评论 -
HDFS 教程(超详细)
文章目录 1. HDFS 介绍 2. HDFS 的 Shell 操作 3. HDFS 客户端操作 4. HDFS 的数据流 5. NameNode 和 SecondaryNameNode 6. DataNode 7. HDFS 2.X 新特性原创 2020-04-27 21:07:09 · 2854 阅读 · 1 评论 -
MapReduce 详细教程
文章目录1. MapReduce 概述1.1 MapReduce 定义1.2 MapReduce 优缺点1.3 MapReduce 核心思想1.4 MapReduce 进程1.5 MapReduce 编程规范1.6 WordCount 案例实操1.6.1 需求1.6.2 需求分析1.6.3 编写程序1. MapReduce 概述1.1 MapReduce 定义 MapReduce 是一个分...原创 2020-05-18 21:24:15 · 2341 阅读 · 0 评论 -
Flume 入门教程(超详细)
文章目录1. Flume 概述1.1 Flume 定义1. Flume 概述1.1 Flume 定义原创 2020-03-10 13:17:56 · 19254 阅读 · 4 评论 -
Kafka 入门教程(超详细)
文章目录1. Kafka 概述1.1 定义1.2 消息队列1.2.1 传统消息队列的应用场景1.2.2 消息队列的两种形式1. Kafka 概述1.1 定义 Kafka 是一个分布式的基于发布/订阅模式的消息队列(Message Queue),主要应用于大数据实时处理领域。1.2 消息队列1.2.1 传统消息队列的应用场景使用消息队列的好处:解耦允许独立的扩展或修改两边...原创 2020-03-29 15:45:20 · 18192 阅读 · 5 评论