![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据
追忆似水华年
这个作者很懒,什么都没留下…
展开
-
Hadoop项目简述
Common:一组分布式文件系统和通用I/O的组件与接口(序列化、Java RPC和持久化数据结构)。Avro:一种支持高效、跨语言的RPC以及永久存储数据的序列化系统。MapReduce:分布式数据处理模型和执行环境,运行于大型商用机集群。HDFS:分布式文件系统,运行于大型商用机集群。Pig:一种数据流语言和运行环境,用以检索非常大的数据集。Pig运行在MapReduce和HDFS的集群上。Hive:一个分布式、按列存储的数据仓库。Hive管理HDFS中存储的数据,并提供基于SQL的查询语言.原创 2020-10-31 18:45:01 · 1140 阅读 · 0 评论 -
大数据部门组织结构图
#mermaid-svg-8PnW9Of7aJsf7Q87 .label{font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family);fill:#333;color:#333}#mermaid-svg-8PnW9Of7aJsf7Q87 .label text{fill:#333}#mermaid-svg-8PnW9Of7aJsf7Q87 .node rect,#mermaid-svg-8PnW9Of7aJ原创 2020-10-17 14:34:04 · 2035 阅读 · 1 评论 -
大数据学习路线
Java基础和Linux基础Hadoop的学习:体系结构、原理、编程。(1)第一阶段:HDFS、MapReduce、HBase(NoSQL数据库)(2)第二阶段:数据分析引擎------->Hive、Pig &.原创 2020-10-16 10:20:42 · 98 阅读 · 0 评论