- 博客(8)
- 收藏
- 关注
原创 Apache Hive 学习回顾
Hive是基于Hadoop的一个数据仓库工具(所以Hive的logo跟大象和黄蜂有关),可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。本质是将SQL转换为MapReduce程序。主要用途:用来做离线数据分析,比直接用MapReduce开发效率更高。
2022-08-23 17:59:36 819
原创 Zookeeper学习
Zookeeper是一个分布式协调服务的框架,主要解决分布式集群中应用系统的一致性问题。本质上是一个分布式的小文件存储系统,类似于Linux文件系统目录树结构,即分层命名空间,但Zookeeper并不是一个专门做文件存储数据的,主要作用是维护和监控存储的数据状态变化,通过监控这些状态的变化进而达到基于数据的集群管理,其节点的数据上限是1MB。......
2022-08-12 23:56:20 489
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人