自己动手写数据库(三) 持久化方案与索引树
推荐一点资源
之前说我所有实现都是Go写的,在MonkeyDB2@Github,但是有些同学可能不喜欢Go的风格或者设计思想, 
 在此推荐大一学弟的项目,Java写的:CauchyDB
内存分块管理
既然要实现一个数据库,我们之前所有的东西都是在内存里面的,这如果服务器关机,那内存里面的数据还不得全部GG啊~所以我们需要对内存进行管理, 
 将所有的数据操作在我们所管理的内存中进行,无论是索引页还是数据页。但是这样还有一个问题,指针所指的地址,在重新启动后就不见了,这该怎么办呢? 
 我们可以采用两种方法:1.对于索引树里的孩子指针等指向本页的指针,使用相对于本页的偏移值存储指针而不是存储实际地址,这样在恢复之后,不需要改动 
 即可正常使用;2.对于指向本页以外的指针(例如索引页指向数据页的指针),使用页首地址+偏移值的方式储存(在MonkeyDB中,我们认为现在的内存大多是 
 小于1TB的,而我们设置的内存块大小是16M,这样1TB*16M=64位寻址空间,使用一个8Byte的字段即可记录页首地址和偏移),这里我们为什么不直接记录指针 
 地址呢,因为我们要恢复的时候是以内存块为单位恢复,我们会用一个表来记录恢复前后的地址,因为记录的是块首地址,所以记录时也是用首地址+偏移。
并发控制
另外,数据库不得不考虑的一个问题就是并发控制,并发控制一般采用读写锁的形式,关于读写锁,可以参见博客:平凡的程序员。 
 我们自己分块管理了内存之后,并发的问题就不难解决了,不论是索引页,还是数据页,我们都继承自内存块,然后对内存

 
                   
                   
                   
                   本文探讨自己动手写数据库时的持久化方案与索引树设计。介绍了内存分块管理,包括如何处理重启后数据丢失问题,提出使用相对偏移值和页首地址+偏移值的指针存储策略。同时讨论了并发控制,通过读写锁确保数据安全。最后讲解了选择B+树作为索引结构的原因,强调了时间复杂度和磁盘IO效率的重要性。
本文探讨自己动手写数据库时的持久化方案与索引树设计。介绍了内存分块管理,包括如何处理重启后数据丢失问题,提出使用相对偏移值和页首地址+偏移值的指针存储策略。同时讨论了并发控制,通过读写锁确保数据安全。最后讲解了选择B+树作为索引结构的原因,强调了时间复杂度和磁盘IO效率的重要性。
           最低0.47元/天 解锁文章
最低0.47元/天 解锁文章
                           
                       
       
           
                 
                 
                 
                 
                 
                
               
                 
                 
                 
                 
                
               
                 
                 扫一扫
扫一扫
                     
              
             
                   1492
					1492
					
 被折叠的  条评论
		 为什么被折叠?
被折叠的  条评论
		 为什么被折叠?
		 
		  到【灌水乐园】发言
到【灌水乐园】发言                                
		 
		 
    
   
    
   
             
            


 
            