Linux硬件-raid(软件版)

作者介绍:简历上没有一个精通的运维工程师。希望大家多多关注作者,下面的思维导图也是预计更新的内容和当前进度(不定时更新)。

RAID

在一般的品牌服务器里面基本上都有一个叫阵列卡的硬件,硬盘先连接到阵列卡上面,然后阵列卡再连接到主板上,大概就是下面这样的。

图片

根据需要对磁盘做阵列以后,暴露给主板或者说操作系统,如果是4块盘,做了RAID5以后,组合成一个盘,对于操作系统而言,看到的就是只有一个盘,但是如果我们从IPMI可以看到4个物理盘组成了一个逻辑盘。并且一般情况下,这些磁盘都是可以在服务器上直接热插拔的。即便有的硬盘坏了,也可以直接拔下来,然后重新换上一个新的硬盘,RAID卡会自动识别并正常加入到RAID中,这个时候操作系统是无法感知到这一切的。

数据需要经过操作系统通过阵列卡,再到磁盘,这个中间是有一个时间差值的,对于阵列卡部分型号是会带一个独立的电池的,也就是对于操作系统而言,数据已经落盘了,但是这个落盘,还在阵列卡里面,还没有写到真正的磁盘里面,如果这个时候系统断电或者崩溃,由于有电池存在,这个数据会存储在阵列卡里面,等待系统恢复的时候在写入到磁盘里面,从而可以提高可靠性。

当然如果是自己DIY的服务器或者是没有阵列卡的设备上,要体验或者要使用RAID功能也是没问题,因为Linux是可以从软件层面来实现。当然在测试环境,我们没有真正的硬件,是无法模拟出来的阵列的情况,所以就通过Linux软件来模拟阵列情况(虽然在实际运维中,可能不会用到,但是把他当成知识扩展以及理解阵列还是可以的)。

#这台服务器,准备了2块多余的磁盘,sdb和sdc,我们使用他来模拟一个RAID1.
[root@localhost ~]# lsblk
NAME            MAJ:MIN RM  SIZE RO TYPE MOUNTPOINT
sda               8:0    0   20G  0 disk 
├─sda1            8:1    0    1G  0 part /boot
└─sda2            8:2    0   19G  0 part 
  ├─centos-root 253:0    0   17G  0 lvm  /
  └─centos-swap 253:1    0    2G  0 lvm  
sdb               8:16   0   20G  0 disk 
sdc               8:32   0   20G  0 disk 
sr0              11:0    1  973M  0 rom

1.软件安装

yum -y install mdadm

2.创建阵列
 

mdadm --create /dev/md0 --level=1 --raid-devices=2 /dev/sdb /dev/sdc --metadata=0.90# /dev/md0 是设备的名字,可根据需要自己定义
# --level=1 是阵列的级别
# --metadata=0.90 主要是兼容性问题

3.查看阵列

#可以看到2个磁盘组成了一个阵列磁盘
[root@localhost ~]# lsblk
NAME            MAJ:MIN RM  SIZE RO TYPE  MOUNTPOINT
sda               8:0    0   20G  0 disk  
├─sda1            8:1    0    1G  0 part  /boot
└─sda2            8:2    0   19G  0 part  
  ├─centos-root 253:0    0   17G  0 lvm   /
  └─centos-swap 253:1    0    2G  0 lvm   
sdb               8:16   0   20G  0 disk  
└─md0             9:0    0   20G  0 raid1 
sdc               8:32   0   20G  0 disk  
└─md0             9:0    0   20G  0 raid1
[root@localhost ~]# ll /dev/md0 
brw-rw---- 1 root disk 9, 0 7月  19 22:19 /dev/md0

​​​​

这个时候我们就有了个20g由阵列提供的磁盘空间,下面的操作就和前面磁盘操作部分一样(创建分区,格式化,挂载等),当然这里只演示了一个简单的RAID阵列,具体更多功能可以自己探索。

4.创建分区

[root@localhost ~]# fdisk /dev/md0 
欢迎使用 fdisk (util-linux 2.23.2)。

更改将停留在内存中,直到您决定将更改写入磁盘。
使用写入命令前请三思。

Device does not contain a recognized partition table
使用磁盘标识符 0x92791e84 创建新的 DOS 磁盘标签。

命令(输入 m 获取帮助):
命令(输入 m 获取帮助):m
命令操作
   a   toggle a bootable flag
   b   edit bsd disklabel
   c   toggle the dos compatibility flag
   d   delete a partition
   g   create a new empty GPT partition table
   G   create an IRIX (SGI) partition table
   l   list known partition types
   m   print this menu
   n   add a new partition
   o   create a new empty DOS partition table
   p   print the partition table
   q   quit without saving changes
   s   create a new empty Sun disklabel
   t   change a partition's system id
   u   change display/entry units
   v   verify the partition table
   w   write table to disk and exit
   x   extra functionality (experts only)

命令(输入 m 获取帮助):n
Partition type:
   p   primary (0 primary, 0 extended, 4 free)
   e   extended
Select (default p): 
Using default response p
分区号 (1-4,默认 1):
起始 扇区 (2048-41942911,默认为 2048):
将使用默认值 2048
Last 扇区, +扇区 or +size{K,M,G} (2048-41942911,默认为 41942911):
将使用默认值 41942911
分区 1 已设置为 Linux 类型,大小设为 20 GiB

命令(输入 m 获取帮助):w
The partition table has been altered!

Calling ioctl() to re-read partition table.
正在同步磁盘。

5.格式化

#分区名字可以通过lsblk或者直接看/dev里面的设备名字来获取
[root@localhost ~]# mkfs.ext4 /dev/md0p1 
mke2fs 1.42.9 (28-Dec-2013)
文件系统标签=
OS type: Linux
块大小=4096 (log=2)
分块大小=4096 (log=2)
Stride=0 blocks, Stripe width=0 blocks
1310720 inodes, 5242608 blocks
262130 blocks (5.00%) reserved for the super user
第一个数据块=0
Maximum filesystem blocks=2153775104
160 block groups
32768 blocks per group, 32768 fragments per group
8192 inodes per group
Superblock backups stored on blocks: 
    32768, 98304, 163840, 229376, 294912, 819200, 884736, 1605632, 2654208, 
    4096000

Allocating group tables: 完成                            
正在写入inode表: 完成                            
Creating journal (32768 blocks): 完成
Writing superblocks and filesystem accounting information: 完成

6.挂载

[root@localhost ~]# mkdir /mnt/raid
[root@localhost ~]# mount /dev/md0p1 /mnt/raid
[root@localhost ~]# df -h
文件系统                 容量  已用  可用 已用% 挂载点
devtmpfs                 475M     0  475M    0% /dev
tmpfs                    487M     0  487M    0% /dev/shm
tmpfs                    487M  7.7M  479M    2% /run
tmpfs                    487M     0  487M    0% /sys/fs/cgroup
/dev/mapper/centos-root   17G  2.1G   15G   12% /
/dev/sda1               1014M  138M  877M   14% /boot
tmpfs                     98M     0   98M    0% /run/user/0
/dev/md0p1                20G   45M   19G    1% /mnt/raid

7.检查下RAID的状态

#两个磁盘组成的RAID是正常的
[root@localhost ~]# mdadm --detail /dev/md0  
/dev/md0:
           Version : 0.90
     Creation Time : Fri Jul 19 22:19:27 2024
        Raid Level : raid1
        Array Size : 20971456 (20.00 GiB 21.47 GB)
     Used Dev Size : 20971456 (20.00 GiB 21.47 GB)
      Raid Devices : 2
     Total Devices : 2
   Preferred Minor : 0
       Persistence : Superblock is persistent

       Update Time : Fri Jul 19 22:28:19 2024
             State : clean 
    Active Devices : 2
   Working Devices : 2
    Failed Devices : 0
     Spare Devices : 0

Consistency Policy : resync

              UUID : 0794079f:4ce9add0:bfe78010:bc810f04 (local to host localhost.localdomain)
            Events : 0.18

    Number   Major   Minor   RaidDevice State
       0       8       16        0      active sync   /dev/sdb
       1       8       32        1      active sync   /dev/sdc

8.模拟下磁盘故障,掉盘

root@localhost ~]# mdadm --detail /dev/md0  
/dev/md0:
           Version : 0.90
     Creation Time : Fri Jul 19 22:19:27 2024
        Raid Level : raid1
        Array Size : 20971456 (20.00 GiB 21.47 GB)
     Used Dev Size : 20971456 (20.00 GiB 21.47 GB)
      Raid Devices : 2
     Total Devices : 1
   Preferred Minor : 0
       Persistence : Superblock is persistent

       Update Time : Fri Jul 19 22:31:55 2024
             State : clean, degraded 
    Active Devices : 1
   Working Devices : 1
    Failed Devices : 0
     Spare Devices : 0

Consistency Policy : resync

              UUID : 0794079f:4ce9add0:bfe78010:bc810f04 (local to host localhost.localdomain)
            Events : 0.18

    Number   Major   Minor   RaidDevice State
       -       0        0        0      removed
       1       8       16        1      active sync   /dev/sdb

## 可以看到,已经有块盘离线了
## 下面我们继续挂载,然后向里面写数据,都是ok的,体现了raid的1高可用性。

[root@localhost ~]# mount /dev/md0p1 /mnt/raid
[root@localhost ~]# cd /mnt/raid
[root@localhost raid]# touch abcd
[root@localhost raid]# ll
总用量 16
-rw-r--r-- 1 root root     0 7月  19 22:34 abcd
drwx------ 2 root root 16384 7月  19 22:24 lost+found
[root@localhost raid]#

因为是raid1 是允许故障一个盘的。

总结

  1. 了解阵列原理及实现方式,在实际运维中还是很有用处的。

  2. 软件阵列如果坏了,还是比较难修的,作为理解阵列倒是没啥问题的。

关注微信公众号《运维小路》获取更多内容。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值