![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据技术原理与应用
文章平均质量分 93
Alascanfu
O ever youthful, O ever weeping
展开
-
Principle And Application Of Big Data Technology——第四章——分布式数据库HBase
HBase 是谷歌BigTable的开源实现HBase 实际上就是一个稀疏、多维、持久化存储的映射表,它采用行键、列族、列限定符和时间戳进行索引。HBase 中需要使用行键、列族、列限定符和时间戳来确定一个单元格,因此可以视为一个“四维坐标”,即{行键,列族,列限定符,时间戳}在 HBase 的概念视图中,一个表可以视为一个稀疏、多维的映射关系 HBase 的实现原理 ,包括 HBase 的功能组件、表 和 Region ,以及Region 定位。库函数: 用于链接到每一个客户端一个 Master 主服务原创 2022-06-17 23:13:56 · 182 阅读 · 0 评论 -
Principle And Application Of Big Data Technology——第二章与第三章——大数据处理架构Hadoop与分布式文件系统
谷歌 MapReduce 与 GFS 是 Hadoop 的MapperReduce 与 HDFS 的闭源版本 ,同时Hadoop也是 根据 谷歌发布的论文进行的开源实现。伪分布式安装是指 在一台机器上模拟一个小的集群,但是集群中只有一个节点。单击Hadoop只在一台机器上运行,存储采用本地文件系统,没有采用HDFS。对于伪分布式配置,我们需要修改 core-site.xml 、hdfs-site.xml 这两个文件。Linux 、Windos等操作系统中,文件系统一般会把磁盘空间划分为每 ,称之为"磁盘块"原创 2022-06-17 19:42:38 · 408 阅读 · 0 评论