大数据
大数据搭建
Xiao爱好
这个作者很懒,什么都没留下…
展开
-
大数据之hive(尚硅谷)Hive基本概念,hive数据结构,hiveDDL定义语言
文章目录第一章 Hive基本概念 第一章 Hive基本概念原创 2020-05-29 15:39:25 · 678 阅读 · 0 评论 -
大数据学习之(Flume)(尚硅谷资料)(未完成)
文章目录概述优点架构Flume Agent内部原理:flume安装部署案例:案例需求:实现步骤 概述 Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。Flume基于流式架构,灵活简单。(用来收集日志的) 流式架构:采集日志的单位是一行一行的,处理单位很小。而mapreduce是一个文件一个文件处理,spark是一块一块的处理。 优点 可以和任意存储进程集成。 输入的的数据速率大于写入目的存储的速率,flume会进行缓冲,减小hdfs的压力。 flum原创 2020-05-25 20:42:36 · 270 阅读 · 0 评论