大白话解析LevelDB: WritableFile 接口

Howard0o0

已于 2024-01-23 21:45:59 修改

阅读量2.1k

点赞数 35

分类专栏：大白话解析LevelDB 文章标签： c++ 数据库

于 2023-12-20 22:10:27 首次发布

本文链接：https://blog.csdn.net/sinat_38293503/article/details/135118828

版权

大白话解析LevelDB 专栏收录该内容

29 篇文章 9 订阅

订阅专栏

文章目录

WritableFile

WritableFile

由于文件写入在不同平台(比如posix && win)需要使用不同的接口，所以LevelDB将文件写入相关的操作抽象出了一个接口WritableFile，如下：

class LEVELDB_EXPORT WritableFile {
   public:
    WritableFile() = default;

    WritableFile(const WritableFile&) = delete;
    WritableFile& operator=(const WritableFile&) = delete;

    virtual ~WritableFile();

    // 往文件中追加数据
    virtual Status Append(const Slice& data) = 0;
    // 关闭文件
    virtual Status Close() = 0;
    // 将缓冲区里的数据 flush 到文件(内核缓冲区)，并清空缓冲区
    virtual Status Flush() = 0;
    // 将内核缓冲区里的数据刷盘
    virtual Status Sync() = 0;
};

WritableFile的实现必须是带有缓冲机制的，因为调用者可能会一次只写入一小部分数据。

如果不带缓冲机制，每次写入少量数据时都要调用一次系统调用 write，会降低写入性能很差(频繁的系统调用会增加开销)。

LevelDB 中提供了两种实现WritableFile的方式：

PosixWritableFile：基于posix的文件写入实现
WinWritableFile：基于win的文件写入实现

本文只关注PosixWritableFile的实现，嘿嘿。

WritableFile 的构造

WritableFile的构造由Env::NewWritableFile(const std::string& fname, WritableFile** result)来负责。

在 posix 环境下，Env::NewWritableFile的实现如下：

Status NewWritableFile(const std::string& filename, WritableFile** result) override {
    // O_TRUNC: 如果文件已存在，则将其清空。
    // O_WRONLY: 以只写方式打开文件。
    // O_CREAT: 如果文件不存在，则创建文件。
    // kOpenBaseFlags: 一些基本的 flags，比如 O_CLOEXEC。
    int fd = ::open(filename.c_str(), O_TRUNC | O_WRONLY | O_CREAT | kOpenBaseFlags, 0644);
    if (fd < 0) {
        *result = nullptr;
        return PosixError(filename, errno);
    }

    // 创建一个 PosixWritableFile 对象
    *result = new PosixWritableFile(filename, fd);
    return Status::OK();
}

O_CLOEXEC的作用可移步参考这里。

通过阅读Env::NewWritableFile的代码实现，我们知道了WritableFile在 posix 环境下是通过new一个PosixWritableFile对象来实现的。

那么接下来我们看下PosixWritableFile这个类的实现。

PosixWritableFile

PosixWritableFile 的构造

PosixWritableFile的构造很简单，只是将filename与fd传入，保存到PosixWritableFile的成员变量中即可。

这里顺便介绍下PosixWritableFile里各个成员变量:

pos_：当前文件的写入位置
fd_：文件描述符
is_manifest_：是否是 manifest 文件。如果是 manifest 文件，那么在写入时会加锁。
filename_：文件名
dirname_：文件所在目录名。传入的filename是一个绝对路径，可以从filename中获取dirname_。

PosixWritableFile(std::string filename, int fd)
    : pos_(0),
        fd_(fd),
        is_manifest_(IsManifest(filename)),
        filename_(std::move(filename)),
        dirname_(Dirname(filename_)) {}

PosixWritableFile::Append(const Slice& data)

Append方法的作用是将数据追加到文件。

首先尝试将数据尽可能多的拷贝到 PosixWritableFile 的缓冲区里，如果缓冲区被打满了，就将缓冲区的数据 flush 到文件，然后清空缓冲区。
然后，对于剩余的数据:

如果能被缓冲区装下，那么将数据拷贝到缓冲区
否则，直接将数据写入到文件

Status Append(const Slice& data) override {
    // 待写入的数据大小
    size_t write_size = data.size();
    // 待写入的数据
    const char* write_data = data.data();

    // Fit as much as possible into buffer.
    // 计算可以拷贝到缓冲区的数据大小，取write_size和缓冲区剩余空间的较小值
    size_t copy_size = std::min(write_size, kWritableFileBufferSize - pos_);
    // 把能拷贝的数据拷贝到缓冲区
    std::memcpy(buf_ + pos_, write_data, copy_size);
    // 更新 write_data: 指向待写入的数据
    write_data += copy_size;
    // 更新 write_size: 待写入的数据大小
    write_size -= copy_size;
    // 更新 pos_: 缓冲区中可写入数据的位置
    pos_ += copy_size;

    // 如果把数据拷贝到缓冲区，待写入到数据大小为 0 了，表示要写入到数据
    // 已经全部放到缓冲区里了，此时可直接返回，等下次再写入数据把缓冲区打
    // 满了再把缓冲区里的数据 flush 到文件。
    if (write_size == 0) {
        return Status::OK();
    }

    // Can't fit in buffer, so need to do at least one write.
    // 缓冲区的剩余空间无法一次性装下待写入的数据，此时需要通过 FlushBuffer 方法
    // 先将缓冲区的数据 flush 到文件，并清空缓冲区。
    Status status = FlushBuffer();
    if (!status.ok()) {
        return status;
    }

    // Small writes go to buffer, large writes are written directly.
    // 缓冲区里的数据清空后，此时的待写入数据若可以被缓冲区装下，
    // 那么就将数据拷贝到缓冲区，然后返回。
    if (write_size < kWritableFileBufferSize) {
        std::memcpy(buf_, write_data, write_size);
        pos_ = write_size;
        return Status::OK();
    }

    // 待写入数据还是无法被缓冲区装下，那将这部分的待写入数据直接写入文件。
    return WriteUnbuffered(write_data, write_size);
}

PosixWritableFile::FlushBuffer()

FlushBuffer方法的作用是将缓冲区的数据 flush 到文件，并清空缓冲区。

Status FlushBuffer() {
    // 将缓冲区里的数据写入到文件
    Status status = WriteUnbuffered(buf_, pos_);
    // 清空缓冲区
    pos_ = 0;
    return status;
}

PosixWritableFile::WriteUnbuffered(const char* data, size_t size)

WriteUnbuffered方法的作用是将数据直接写入到文件。它会循环调用write系统调用，直到所有数据都已写入。

Status WriteUnbuffered(const char* data, size_t size) {
    // 只要待写入数据大小还大于 0，就一直尝试写入
    while (size > 0) {
        // 通过系统调用 ::write 将数据写入到文件
        ssize_t write_result = ::write(fd_, data, size);
        // write_result < 0，表示 ::write 系统调用失败。
        if (write_result < 0) {
            // 如果只是因为中断导致的写入失败，那么尝试重新写入
            if (errno == EINTR) {
                continue;  // Retry
            }
            // 如果是其他原因导致的写入失败，那么返回错误
            return PosixError(filename_, errno);
        }
        // write_result > 0，表示成功写入到文件的数据大小。
        // 有可能我们通过系统调用 ::write 写入 10KB 的数据，但只会成功写入一部分，
        // 比如当磁盘空间不足的时候就会这样。
        // 
        // 更新 data 与 size，继续尝试写入剩余的数据。
        data += write_result;
        size -= write_result;
    }
    return Status::OK();
}

PosixWritableFile::Flush()

PosixWritableFile::Flush()的实现就是调用FlushBuffer()方法，将缓冲区的数据 flush 到文件，并清空缓冲区。

Status Flush() override { return FlushBuffer(); }

PosixWritableFile::Sync()

Sync方法的作用是将缓冲区里的数据 flush 到文件(其实是 flush 到内核缓冲区)，并将内核缓冲区里的数据刷盘。

如果该 WritableFile 是个 manifest 文件，那么在将该 manifest 文件刷盘前，还需要先将该 manifest 文件所在的目录刷盘，确保其所在目录已经先创建出来了，然后再对该 manifest 文件进行刷盘。

Status Sync() override {
    // 将 manifest 文件所在的目录刷盘。
    // 如果当前 WritableFile 是个 manifest 文件，那么在将该 manifest 刷盘前，
    // 需要先将该 manifest 文件所在的目录刷盘，确保其所在目录已经先创建出来了，
    // 然后再刷盘该 manifest 文件。
    Status status = SyncDirIfManifest();
    if (!status.ok()) {
        return status;
    }

    // 将缓冲区里的数据 flush 到文件(其实是内核缓冲区中)
    status = FlushBuffer();
    if (!status.ok()) {
        return status;
    }

    // call 系统调用 ::fsync 将内核缓冲区中的数据刷盘
    return SyncFd(fd_, filename_);
}

PosixWritableFile::SyncDirIfManifest()

SyncDirIfManifest方法的作用是将 manifest 文件所在的目录刷盘。

Status SyncDirIfManifest() {
    Status status;
    // 如果不是 manifest 文件的话，直接返回 OK
    if (!is_manifest_) {
        return status;
    }

    // 打开 manifest 文件所在的目录，获取其文件描述符
    int fd = ::open(dirname_.c_str(), O_RDONLY | kOpenBaseFlags);
    if (fd < 0) {
        status = PosixError(dirname_, errno);
    } else {
        // 将该目录刷盘
        status = SyncFd(fd, dirname_);
        ::close(fd);
    }
    return status;
}

PosixWritableFile::SyncFd(int fd, const std::string& filename)

SyncFd方法的作用是将文件手动刷盘，确保数据已经持久化到磁盘，而不是停留在内核缓冲区中等待内核刷盘。

static Status SyncFd(int fd, const std::string& fd_path) {
#if HAVE_FULLFSYNC
    // 在 macOS 和 iOS 平台上，仅仅只是使用 fsync() 并不能保证数据在掉电后的持久化，
    // 需要配合 fcntl(F_FULLFSYNC)。
    if (::fcntl(fd, F_FULLFSYNC) == 0) {
        return Status::OK();
    }
#endif  // HAVE_FULLFSYNC

    // 如果平台支持 fdatasync 的话，就用 fdatasync 刷盘，
    // 否则的话就用 fsync 刷盘。
    // fdatasync 与 fsync 的区别在于，fdatasync 只会刷盘文件的 data 部分，
    // 而 fsync 会刷盘文件的 data 部分和 meta 部分。meta 部分包含一些文件信息，
    // 如文件大小，文件更新时间等。
    // fdatasync 比 fsync 更高效。
#if HAVE_FDATASYNC
    bool sync_success = ::fdatasync(fd) == 0;
#else
    bool sync_success = ::fsync(fd) == 0;
#endif  // HAVE_FDATASYNC

    if (sync_success) {
        return Status::OK();
    }
    return PosixError(fd_path, errno);
}

PosixWritableFile::Close()

Close方法的作用是关闭文件。它首先将缓冲区的数据写入到文件，然后关闭文件。

Status Close() override {
    // 关闭前先把缓冲区里的数据 flush 到文件
    Status status = FlushBuffer();
    // 通过系统调用 ::close 关闭文件
    const int close_result = ::close(fd_);
    if (close_result < 0 && status.ok()) {
        status = PosixError(filename_, errno);
    }
    fd_ = -1;
    return status;
}

Howard0o0

关注

35
点赞
踩
48

收藏

觉得还不错? 一键收藏
1
评论
大白话解析LevelDB: WritableFile 接口

由于文件写入在不同平台(比如posix && win)需要使用不同的接口，所以LevelDB将文件写入相关的操作抽象出了一个接口`WritableFile`。本文只关注`PosixWritableFile`的实现，嘿嘿。
复制链接

扫一扫