Linux块设备缓存Bcache使用

1 Bcache简介

Bcache是Linux内核块层cache,它使用SSD来作为HDD硬盘的cache,从而起到加速作用。Bcache内核模块仅在Linux 3.10及以上版本支持,因此使用Bcache,需要将内核升级到3.10及以上版本,并在内核配置项中打开Bcache模块

Bcache具有以下特征

  • 一个缓存设备可以作为多个设备的缓存,并且可以在设备运行时动态添加和删除缓存
  • 可以从非正常状态关机中恢复,只有当缓存写入到后端设备才会确认写完成
  • 正确处理写阻塞和刷缓存
  • 支持writethrough、writeback和writearound等写缓存模式
  • 检测并避开顺序IO(可配置阈值,或关闭该选项)
  • 当检测到SSD延迟超过配置边界值,减少到SSD流量(当一个SSD作为多个磁盘缓存时使用)
  • 缓存不命中时预读(默认关闭)
  • 高性能的writeback实现:脏数据通过排序后再刷到磁盘中。如果设置了writeback_percent值,后台的writeback进程利用PD控制器根据脏数据比例平滑地处理脏数据
  • 使用高效率的B+树,硬件设备足够快速的情况下,bcache随机读可以达到1M IOPS
  • 可在生产中稳定的使用

相关名词

  • cache device: 缓存盘(前端), 一般为SSD高速磁盘设备
  • backing device: 数据盘(后端), 一般为HDD低速磁盘设备

2 Bcache的缓存策略

Bcache支持三种缓存策略:writeback(回写策略)writethrough(写通策略)writearound(旁路策略)。默认使用writethrough,缓存策略可动态修改。

  • writeback:此策略模式下,则所有的数据将先写入缓存盘,然后等待系统将数据回写到后端数据盘中,此策略默认关闭。
  • writethrough:此策略模式下,数据同时写入缓存盘和后端数据盘,适用于读多写少的场景,此策略默认打开。
  • writearound:选择此策略,数据将直接写入后端磁盘。

3 编译安装bcache-tools工具

要使用bcache,需要安装相关的工具包bcache-tools。

下载链接:https://git.kernel.org/pub/scm/linux/kernel/git/colyli/bcache-tools.git/snapshot/bcache-tools-1.1.tar.gz

3.1 安装步骤

  1. 将下载的bcache-tools上传到服务器/opt/目录下

  2. 解压缩,切换工作目录

    cd /opt/
    tar -zxvf bcache-tools-1.1.tar.gz
    cd bcache-tools-1.1/
    
  3. 安装依赖

    yum install libblkid-devel -y
    
  4. 安装

    make
    make install
    
  5. 验证

    image-20231017213525225

3.2 依赖处理

pkg-config: not found

# Ubuntu
apt install pkg-config

Package uuid was not found in the pkg-config search path.
Perhaps you should add the directory containing uuid.pc
to the PKG_CONFIG_PATH environment variable
No package ‘uuid’ found

# Ubuntu
apt install uuid-dev

Package blkid was not found in the pkg-config search path.
Perhaps you should add the directory containing blkid.pc
to the PKG_CONFIG_PATH environment variable
No package ‘blkid’ found

# Ubuntu
apt install libblkid-dev
# CentOS
yum install libblkid-devel

Package smartcols was not found in the pkg-config search path.
Perhaps you should add the directory containing `smartcols.pc’
to the PKG_CONFIG_PATH environment variable
No package ‘smartcols’ found

# Ubuntu
apt install libsmartcols-dev
# CentOS
yum install liblibsmartcols-devel

4 Bcache基本操作

/dev/sdl/dev/sdx是SSD设备,我们用/dev/sdl这块SSD加速/dev/sda/dev/sdb两块HDD。

4.1 创建bcache后端和缓存磁盘

make-bcache -B /dev/sda /dev/sdb -C /dev/sdl # 自动关联Bcache设备
或者
make-bcache -B /dev/sda /dev/sdb
make-bcache -C /dev/sdl
bcache attach /dev/sdl /dev/sda # 手动关联
bcache attach /dev/sdl /dev/sdb

4.2 查看Bcache当前的状态

[root@ceph01 ~]# bcache show -m
Name            Uuid                                    Cset_Uuid                               Type    State                    Bname           AttachToDev     AttachToCset
/dev/sdb        12dee1f4-05ab-4e13-9262-dcea08dbfda0    354761ed-4f32-4064-8df3-3c74bbaf389b    1 (data)clean(running)   bcache1         /dev/sdl        354761ed-4f32-4064-8df3-3c74bbaf389b
/dev/sdl        f73a9156-8468-4001-b4ef-1ed508d34a08    354761ed-4f32-4064-8df3-3c74bbaf389b    3 (cacheactive           N/A             N/A             N/A
/dev/sda        e022596f-c813-46db-a48e-e7504065be31    354761ed-4f32-4064-8df3-3c74bbaf389b    1 (data)clean(running)   bcache0         /dev/sdl        354761ed-4f32-4064-8df3-3c74bbaf389b

image-20231018173100094

直接把/dev/bcache0/dev/bcache1当做磁盘分区格式化挂载使用即可。

4.3 删除后端低速数据盘

每一块低速盘(HDD)在经过make-bcache后,都会对应一个Bname,例如,bcache0、bcache1等。删除低速盘就是将对应的Bname设备停掉(删掉)。如果该Bname对应的设备有绑定前端盘(SSD),需要先解除与前端盘的关联。

# 获取后端设备的cset.uuid
[root@ceph01 ~]# bcache-super-show /dev/sda
sb.magic                ok
sb.first_sector         8 [match]
sb.csum                 44D5ED8229F0D21C [match]
sb.version              1 [backing device]

dev.label               (empty)
dev.uuid                e022596f-c813-46db-a48e-e7504065be31
dev.sectors_per_block   1
dev.sectors_per_bucket  1024
dev.data.first_sector   16
dev.data.cache_mode     0 [writethrough]
dev.data.cache_state    1 [clean]

cset.uuid               354761ed-4f32-4064-8df3-3c74bbaf389b

# 通过获取到的cset.uuid移除bcache0的绑定
[root@ceph01 ~]# echo 354761ed-4f32-4064-8df3-3c74bbaf389b > /sys/block/bcache0/bcache/detach
# 删除后端盘
[root@ceph01 ~]# echo 1 > /sys/block/bcache0/bcache/stop

4.4 删除前端高速缓存盘

[root@ceph01 ~]# ls /sys/fs/bcache/
354761ed-4f32-4064-8df3-3c74bbaf389b  register  register_quiet
# 取消前端高速缓存盘的注册
[root@localhost opt]# echo 1 >/sys/fs/bcache/354761ed-4f32-4064-8df3-3c74bbaf389b/unregister

4.5 查看当前缓存数据量及调整回写阈值

[root@ceph01 ~]# cat /sys/block/bcache0/bcache/dirty_data
0.0k

# 当缓存策略为writeback时, 运行一段时间后会有一定的缓存数据量
[root@ceph01 ~]# cat /sys/block/bcache0/bcache/dirty_data
24.7G

# 有几个参数来控制缓存的回写时机, 参数均在: /sys/block/bcache0/bcache/ 目录下
- writeback_percent: 如果非零, bcache会尝试保持这个百分比的缓存脏数据, 限制后台回写并使用PD控制器平滑调整比率, 默认10 (脏数据量占SSD磁盘空间的百分之十时才开始回写, 否则一直在SSD中?)
- writeback_delay: 当脏数据写入缓存并且之前没有包含任何数据时, 在启动写回之前等待一些秒数. 默认为30
- writeback_rate: 每秒扇区速率, 如果writeback_percent非零, 则回写被限制到这个速率. 由bcache不断调整, 但可能也可以由用户设置
- writeback_running: 如果关闭, 则不会发生脏数据的回写, 脏数据仍将被添加到缓存中, 直到其将要满时. 仅用于基准测试. 默认开启

# 将writeback_percent调整至0, 也就意味着会将所有的dirty data都刷到backing device中
[root@ceph01 ~]# echo 0 > /sys/block/bcache0/bcache/writeback_percent

4.6 查看及调整缓存策略

# 查看当前默认策略
[root@ceph01 ~]# cat /sys/block/bcache0/bcache/cache_mode
[writethrough] writeback writearound none

# 修改缓存策略为: writeback
[root@ceph01 ~]# echo writeback > /sys/block/bcache0/bcache/cache_mode

# 再次查看
[root@ceph01 ~]# cat /sys/block/bcache0/bcache/cache_mode
writethrough [writeback] writearound none

4.7 相关问题

4.7.1 Already a bcache device on /dev/sdX, overwrite with –wipe-bcache

[root@localhost opt]# make-bcache -B /dev/sdc
Already a bcache device on /dev/sdc, overwrite with --wipe-bcache

# 这是因为之前这块盘已经make-bcache过了, 可能出现在反复试验的时间, 多次创建、删除
[root@localhost opt]# make-bcache -B /dev/sdc --wipe-bcache
UUID:			3b3c8cd1-864b-4fdb-9283-a2e212d0d290
Set UUID:		92d8465a-0720-4b30-8f7d-988abdf3ee85
version:		1
block_size:		1
data_offset:	16

4.7.2 Can’t open dev /dev/sdX: Device or resource busy

# 一个例子,/dev/sdb是前端缓存盘,/dev/sdc是后端数据盘
# 这个错误出现在我试验过程中, 在重新创建前端高速缓存设备的时间
# 这是因为前端高速缓存设备已经创建过了, 并未删除导致的
# 解决方法:
	1. 查看ls /sys/fs/bcache/
	2. 对前端缓存盘进行删除(取消注册)
[root@localhost opt]# lsblk
NAME            MAJ:MIN RM  SIZE RO TYPE MOUNTPOINT
sdb               8:16   0   30G  0 disk 
sdc               8:32   0  100G  0 disk 
sda               8:0    0   20G  0 disk 
├─sda2            8:2    0   19G  0 part 
│ ├─centos-swap 253:1    0    2G  0 lvm  [SWAP]
│ └─centos-root 253:0    0   17G  0 lvm  /
└─sda1            8:1    0    1G  0 part /boot

[root@localhost opt]# make-bcache -C /dev/sdb
Can't open dev /dev/sdb: Device or resource busy

# 查看前端高速缓存设备注册信息?
[root@localhost opt]# ls /sys/fs/bcache/
0b241b68-c354-461d-9ca1-ea00448057a9  pendings_cleanup  register  register_quiet

# 由于当前系统是干净的, 但是/sys/fs/bcache/目录下存在注册信息, 应该是忘记删除导致的
# 对该注册信息进行删除(取消注册)
[root@localhost opt]# echo 1 >/sys/fs/bcache/0b241b68-c354-461d-9ca1-ea00448057a9/unregister

[root@localhost opt]# ls /sys/fs/bcache/
pendings_cleanup  register  register_quiet

# 重新创建前端高速缓存设备
[root@localhost opt]# make-bcache -C /dev/sdb --wipe-bcache
UUID:			ba550b3f-646b-4740-8192-b9b2bebc3d63
Set UUID:		f8361f22-92c3-421e-8a21-e5a5c6997508
version:		0
nbuckets:		61440
block_size:		1
bucket_size:		1024
nr_in_set:		1
nr_this_dev:		0
first_bucket:		1

[root@localhost opt]# ls /sys/fs/bcache/
f8361f22-92c3-421e-8a21-e5a5c6997508  pendings_cleanup  register  register_quiet

参考

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值