MySQL,HDFS,HBase相似之处

最新推荐文章于 2025-09-21 15:47:13 发布

原创

最新推荐文章于 2025-09-21 15:47:13 发布 · 2.8k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#hbase #mysql

本文探讨了MySQL、HDFS和HBase之间的相似之处，包括预写日志机制、高可用性（如MySQL双主复制与HDFS HA）、缓存策略（如MemStore、BlockCache与MySQL缓冲池）以及事务标识（如LSN、事务ID和序列号）。通过对这些特性的比较，展示了三者在数据持久化和一致性上的共通点。

这几天一直在看MySQL底层的一些东西，看到最后，越来越觉得MySQL，HBase,HDFS之间有很多相似的地方，所以在这里来记录这些相似之处，和大家一起学习。

1. 预写日志

在MySQL Innodb中，有Redo日志和二进制日志。当我们进行数据库更改的时候，更改的操作会记录在Redo日志中，同时也会记录在二进制日志中。Redo日志主要保证了事务的持久性，以后可以通过回放Redo中的修改操作，来进行数据的修复。Redo日志主要记录了对页的物理修改。
在HDFS中，如果我们有修改操作的话，首先，我们会通过RPC来访问NameNode,那么这次操作会先记录在Edits Log中，然后在对NameNode 内存中的文件系统或者文件元数据进行修改。这里每次修改操作都会先记录在Edits Log中，然后才会去内存中进行修改操作。
在HBase中，有预写日志(WAL),每个RegionServer共享一个WAL,每次进行修改操作的时候，会首先把该操作记录到WAL中去，然后再去memstore中进行数据的修改操作，只有这样，才算一次修改完成。

2. Hadoop HDFS HA(高可用性)和MySQL双主复制

我们知道，Hadoop 2.0中HDFS引入了HA(高可用性)，即一个集群中有两个NameNode，Active NameNode和StandBy NameNode，只有Active NameNode 向外进行服务。Active NameNode和StandBy NameNode中的内存中文件系统和文件元数据是一样的。当Active NameNode中的Edits Log内容增加时，其会把增加的内容写到一些叫做Journal Node节点上，Standby NameNode监测到Edits Log变化的时

最低0.47元/天解锁文章