![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据技术
七钥
这个作者很懒,什么都没留下…
展开
-
Spark葵花宝典:一小时速成Spark
你会Spark么?不会?来这里,一小时让你搞明白Scala和RDD语法和spark的用处。原创 2020-07-03 17:38:16 · 5662 阅读 · 7 评论 -
Zookeeper学习提纲:助你一臂之力
ZooKeeperZooKeeper:ZooKeeper是一种分布式协调服务,用于管理大型主机。分布式应用:分布式应用可以在给定时间(同时)在网络中的多个系统上运行,通过协调它们以快速有效的方式完成特定任务分布式应用有两部分:Server(服务器) 和 Client(客户端) 应用程序。服务器应用程序:实际上是分布式的,并具有通用接口,以便客户端可以连接到集群中的任何服务器并获得相同的结果。客户端应用程序:是与分布式应用进行交互的工具。分布式应用的优点:可靠性:单个或几个系统的故障不会使原创 2020-06-25 15:31:55 · 2514 阅读 · 0 评论 -
HBase学习提纲:助你一臂之力
HBase简介: HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。可在廉价PC Server上搭建起大规模结构化存储集群。HBase利用Hadoop HDFS作为其文件存储系统,利用Hadoop MapReduce来处理HBase中的海量数据,利用Zookeeper作为协调工具。 HBase与传统数据库(RDBMS)的最大区别面向列。操作数据库,如果是索引访问用HBase+Hadoop当前市场上有很多类似的序列化系统,如Avro、Google 的 Protocol Buffers、F原创 2020-06-25 15:30:02 · 3146 阅读 · 6 评论