![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Hadoop
裘德、
这个作者很懒,什么都没留下…
展开
-
HBase必备知识点
Hbase是基于HDFS的面向列的分布式数据库,用于海量结构化数据存储。内部的文件全部存储在HDFS上HBase中表的特点:1 大,一个表可以有几十亿行,上百万列2 面向列,面向列族的存储和权限控制,列簇的独立检索3 稀疏,对于为空的列,并不占据空间,因此表的设计可以非常稀疏4 无模式,每行又有一个可排序的主键和任意多的列,列可以根据需要动态的添加,同一张表不同的行可以使用不同的列Hb...原创 2020-03-04 00:13:19 · 252 阅读 · 0 评论 -
HDFS必备知识点
Hadoop中的组件:HDFS、MapReduce、Yarn、Hive、Hbase、zookeeper、Sqoop、flume、yarn、pig、mahout其它开源组件:impala、spark、storm、kafka、redis、flink等Hdfs:分布式文件存储系统主节点:namenode,secondarynamenodeNamenode:保存HDFS上元数据的信息:命名空间信...原创 2020-03-02 18:21:40 · 319 阅读 · 0 评论