MYSQL虽是一个行数据库,但是研究列存储技术可以先以它为模板,以列存储引擎实现按行的查询分析功能.首先,在它提供的框架之下,先实现一个简单的引擎,然后将它一点一点地修改成标准的列存储引擎.本周的规划大致如下:
- 实现一个磁盘管理模块,也就是一个文件系统,它将一个文件作为一块磁盘或者磁盘的确个分区,进行文件的管理.管理的每个文件就是一个"数据块",文件名就是数据块的"块号",暂时先将文件名固定为数字编号,第一个文件的文件名就是"1",第N个文件的文件名就是"N".基本的功能要有:
- 创建一个空文件:由系统决定其文件名,而不让创建者自己决定,创建完文件后返回这个新那的文件的文件名.
- 将指定的内容写入到指定的文件中.指定的内容就是一个内存地址,以及该内容的长度,以字节为单位.文件名就是文件的编号,该编号必须是系统中已经存在的.否则就返回一个"文件不存在"的错误号.
- 将指定的文件读入到内存中.调用者必须提供足够的内存来容纳该文件.
- 将指定的文件中从第N个字节开始的M个字节读入到内存中.
- 删除指定文件名的文件.
- 将指定文件名的文件的内容替换为指定的内容.
- 实现MYSQL存储引擎中的块管理模块.该部分以磁盘管理模块为辅助模块,操作中间层的"块",将数据的INSERT,UPDATE和DELETE操作转换为"块内的操作",待块完成自己的操作后将相应的结果反馈到磁盘上.具体应该具有以下功能:
- 创建文件:新建一个数据库时,对应CREATE TABLE语句.
- 删除文件:对应DROP TABLE语句.
- 重命名文件:对应 RENAME TABLE语句.
- 打开文件:当要对某个数据库进行各种操作时,首先得打开这个数据库.
- 关闭文件:当已经决定不再需要使用这个数据库时,得关闭这个数据库.
- INSERT操作:向数据库添加一条数据时,将MYSQL查询分析器提供的行格式的数据转换成列格式,并分析由各个列管理模块来实现各自的操作.暂时先不排序.
- UPDATE操作:进行UPDATE操作时,将MYSQL上层提供的新值转换为列格式,并分别由各个列来实现.暂时先留着.
- DELETE操作:暂时先留着.
- 遍历数据库:当SELECT执行时,要从头到尾遍历一下.