搭建高可用OpenStack(Queen版)集群(十)之部署分布式存储Ceph

13 篇文章 0 订阅
10 篇文章 0 订阅

一、Ceph知识点学习

  Ceph知识点学习:https://www.cnblogs.com/happy-king/p/9207509.html

二、部署分布式存储Ceph

  一)设置yum源

  在全部控制与计算节点设置epel与ceph yum源

  epel源:repo安装包下载_开源镜像站-阿里云

  ceph源:ceph安装包下载_开源镜像站-阿里云

  1、设置yum源
wget -O /etc/yum.repos.d/epel-7.repo http://mirrors.aliyun.com/repo/epel-7.repo
cat>/etc/yum.repos.d/ceph.repo<<EOF
[ceph]
name=ceph
baseurl=http://mirrors.aliyun.com/ceph/rpm-luminous/el7/x86_64/
enabled=1
gpgcheck=1
type=rpm-md
gpgkey=http://mirrors.aliyun.com/ceph/keys/release.asc
[ceph-noarch]
name=cephnoarch
baseurl=http://mirrors.aliyun.com/ceph/rpm-luminous/el7/noarch/
enabled=1
gpgcheck=1
type=rpm-md
gpgkey=http://mirrors.aliyun.com/ceph/keys/release.asc
[ceph-source]
name=ceph-source
baseurl=http://mirrors.aliyun.com/ceph/rpm-luminous/el7/SRPMS/
enabled=1
gpgcheck=1
type=rpm-md
gpgkey=http://mirrors.aliyun.com/ceph/keys/release.asc
EOF
  2、重新加载yum源
yum clean all
yum makecache
  3、 查看yum源
yum repolist

  二)基础环境,如hosts,时间同步ntp,开放端口iptables等相关操作

   初始化环境:https://www.cnblogs.com/happy-king/p/9595447.html#_label0

  三)创建用户

  在全部控制与计算节点操作

  1、创建用户
useradd -d /home/ceph -m cephde
echo cephde|passwd --stdin cephde
echo 'cephde ALL=(ALL) NOPASSWD: ALL'>>/etc/sudoers
  2、用户赋权
su - cephde
$ echo "cephde ALL = (root) NOPASSWD:ALL" | sudo tee /etc/sudoers.d/cephde
[sudo] password for cephde:cephde
sudo chmod 0440 /etc/sudoers.d/cephde

  四)设置ssh免密登陆

  • ceph-deploy不支持密码输入,需要在所有控制节点生成ssh秘钥,并将公钥分发到各ceph节点(控制节点和存储节点);
  • 在用户cephde下生成秘钥,不能使用sudo或root用户;
  • 默认在用户目录下生成~/.ssh目录,含生成的秘钥对;
  • “Enter passphrase”时,回车,口令为空;
  • 另外3个控制节点均设置为ceph管理节点,应该使控制管理节点都可以ssh免密登陆到其他所有控制与存储节点
  1、生成秘钥对
# su - cephde
$ ssh-keygen -t rsa
Generating public/private rsa key pair.
Enter file in which to save the key (/home/ceph/.ssh/id_rsa): 
Created directory '/home/ceph/.ssh'.
Enter passphrase (empty for no passphrase): 
Enter same passphrase again: 
Your identification has been saved in /home/ceph/.ssh/id_rsa.
Your public key has been saved in /home/ceph/.ssh/id_rsa.pub.
The key fingerprint is:
1e:a8:cd:c7:45:a9:e0:ef:01:6a:d2:0e:46:a5:8c:d5 cephde@controller03
The key's randomart image is:
+--[ RSA 2048]----+
|                 |
|   .       .     |
|  . E .   o      |
| + o . o o       |
|. +   + S .      |
| . . = = o       |
|  + = o *        |
| . =   o .       |
|    .   .        |
+-----------------+
  2、分发公钥
  • 前提是各控制与存储节点已生成相关用户;
  • 分发成功后,在~/.ssh/下生成known_hosts文件,记录相关登陆信息;
  • 3个控制节点均设置为ceph管理节点,应该使控制管理节点都可以ssh免密登陆到其他所有控制与存储节点

   免交互批量发送公钥脚本: /opt/scripts/shell/ssh-copy.sh (注意需要安装sshpass)

免交互批量发送公钥

  在三个控制节点执行(注意使用cephde用户执行脚本)

  3、设置环境变量(optional(三个控制节点))

  在root账号主目录下,生成~/.ssh/config文件,这样在控制管理节点上执行”ceph-deploy”时可不切换用户或指定”--username {username}”;

  每个节点把自己去掉

/root/.ssh/config

  五)安装ceph-deploy

  在规划的全部控制管理节点安装ceph-deploy工具

yum install ceph-deploy -y

  六)创建ceph集群

  在任意控制节点执行

  1、创建集群
  • 在cephde账户下操作,切忌使用sudo操作;
  • 在管理节点上生成一个目录用于存放集群相关配置文件
su - cephde
mkdir cephcluster

  后续ceph-deploy相关操作全部在所创建的目录执行

  将规划中的MON(monitor)节点纳入集群,即创建集群

cd ~/cephcluster/
ceph-deploy new controller01 controller02 controller03
  2、修改集群配置文件
  • 生成集群后在集群目录下生成3个文件,其中ceph.conf即是配置文件;
  • 默认可不修改,为使服务按规划启动,可做适当修改;
  • 以下红色字体部分是在默认生成的conf文件上新增的配置

  上边命令生成的ceph.conf

ceph.conf

   修改ceph.conf文件

[global]
fsid = 74082074-0322-460a-b962-436fe36f8e7b
mon_initial_members = controller01, controller02, controller03
mon_host = 10.20.9.189,10.20.9.190,10.20.9.45
auth_cluster_required = cephx
auth_service_required = cephx
auth_client_required = cephx

# public network:前端mon网络,client访问网络;确保public network与mon_host在相同网段,否则初始化时可能会有错误;
# cluster network:后端osd心跳,数据/流复制恢复等网络
public_network = 10.20.9.0/24
cluster_network = 10.0.0.0/24

# 默认的副本数为3,实验环境变更为2
osd_pool_default_size = 2

# 默认保护机制不允许删除pool,根据情况设置
mon_allow_pool_delete = true

  七)安装ceph

  在全部控制管理与存储节点安装ceph

  理论上在控制节点的ceph集群目录使用ceph-deploy可统一安装,命令:ceph-deploy install controller01 controller02 controller03 compute01 compute02 compute03;
  但由于网速原因大概率会失败,可在各存储节点独立安装ceph与ceph-radosgw

yum install -y ceph ceph-radosgw

  查看版本

[cephde@controller01 cephcluster]$ ceph -v
ceph version 12.2.8 (ae699615bac534ea496ee965ac6192cb7e0e07c0) luminous (stable)

  八)初始化ceph_mon

  1、初始化monitor

  在任意控制管理节点操作(若/etc/ceph/ceph.conf文件存在,需加上--overwrite-conf 参数)

ceph-deploy mon create-initial
    1、下面是正常情况

  执行完,最后返回如下内容(说明配置没有问题)

............................................................................
[controller01][INFO  ] Running command: sudo /usr/bin/ceph --connect-timeout=25 --cluster=ceph --name mon. --keyring=/var/lib/ceph/mon/ceph-controller01/keyring auth get-or-create client.bootstrap-rgw mon allow profile bootstrap-rgw
[ceph_deploy.gatherkeys][INFO  ] Storing ceph.client.admin.keyring
[ceph_deploy.gatherkeys][INFO  ] Storing ceph.bootstrap-mds.keyring
[ceph_deploy.gatherkeys][INFO  ] Storing ceph.bootstrap-mgr.keyring
[ceph_deploy.gatherkeys][INFO  ] keyring 'ceph.mon.keyring' already exists
[ceph_deploy.gatherkeys][INFO  ] Storing ceph.bootstrap-osd.keyring
[ceph_deploy.gatherkeys][INFO  ] Storing ceph.bootstrap-rgw.keyring
[ceph_deploy.gatherkeys][INFO  ] Destroy temp directory /tmp/tmpbCEBnS

  执行完后,在当前目录下多了如下五个文件

  

    2、下面是报错情况

  报错

[controller02][WARNING] The service command supports only basic LSB actions (start, stop, restart, try-restart, reload, force-reload, status). For other actions, please try to use systemctl.
[controller02][ERROR ] RuntimeError: command returned non-zero exit status: 2
[ceph_deploy.mon][ERROR ] Failed to execute command: /usr/sbin/service ceph -c /etc/ceph/ceph.conf start mon.controller02
[ceph_deploy.mon][DEBUG ] detecting platform for host controller03 ...

  报错原因:epel中的ceph-deploy版本过低,从ceph官网下载最新版即可。

       Index of /rpm-kraken/el7/noarch/

  2、查看状态

  在所有控制节点验证(换成对应的主机名或者使用hostname -s)

systemctl status ceph-mon@controller01

  

  九)分发ceph.conf与秘钥

  • 分发ceph配置文件与秘钥到其他控制管理节点与存储节点;
  • 注意分发节点本身也需要包含在内,默认没有秘钥文件,需要分发;
  • 如果被分发节点已经配置文件(统一变更配置文件场景),可以使用如下命令:
ceph-deploy --overwrite-conf admin xxx

  分发的配置文件与秘钥在各节点/etc/ceph/目录(若其他节点原来存在配置文件,需要加上--overwrite-conf参数)

ceph-deploy --overwrite-conf admin controller01 controller02 controller03 compute01 compute02

  

  十)安装ceph_mgr

  1、安装mgr

  任意控制节点操作

  luminous版本必须安装mgr(dashboard)

ceph-deploy mgr create controller01:controller01_mgr controller02:controller02_mgr controller03:controller03_mgr

  查看状态

systemctl status ceph-mgr@controller01_mgr
sudo netstat -tunlp | grep mgr

  

  2、启动mgr

  任意控制节点操作

  • 可查看mgr默认开启的服务:(sudo) ceph mgr module ls;
  • 默认dashboard服务在可开启列表中,但并未启动,需要手工开启
sudo ceph mgr module enable dashboard

  dashboard服务已开启,默认监听全部地址的tcp7000端口

  若想修改地址和端口,如下操作即可

如果需要设置dashboard的监听地址与端口,如下:
设置监听地址:(sudo) ceph config-key put mgr/dashboard/server_addr x.x.x.x
设置监听端口:(sudo) ceph config-key put mgr/dashboard/server_port x

  验证服务

sudo netstat -tunlp | grep mgr

  

  3、web登录

  默认没有密码

  web登陆:http://10.20.9.189:7000/

  

  十一)查看集群状态

  1、查看monitor状态
sudo ceph mon stat

  

  2、查看ceph状态

  ceph health (detail),ceph -s,ceph -w等;

  状态显示mgr处于active-standby模式

[cephde@controller01 cephcluster]$ sudo ceph -s
  cluster:
    id:     74082074-0322-460a-b962-436fe36f8e7b
    health: HEALTH_OK
 
  services:
    mon: 3 daemons, quorum controller03,controller01,controller02
    mgr: controller01_mgr(active), standbys: controller03_mgr, controller02_mgr
    osd: 0 osds: 0 up, 0 in
 
  data:
    pools:   0 pools, 0 pgs
    objects: 0 objects, 0B
    usage:   0B used, 0B / 0B avail
    pgs:     
  3、可在各节点查看认证信息等
[cephde@controller01 cephcluster]$ sudo ceph auth list
installed auth entries:

client.admin
    key: AQBebJdb89NfFhAA2D9dFESIX2GhrT/O6AmXqA==
    caps: [mds] allow *
    caps: [mgr] allow *
    caps: [mon] allow *
    caps: [osd] allow *
client.bootstrap-mds
    key: AQBfbJdbcfQPDhAA1xdq6WhsiyyG79M6hgEqPQ==
    caps: [mon] allow profile bootstrap-mds
client.bootstrap-mgr
    key: AQBgbJdbTyX/GRAA7RYzmYL7Xx3NnUFg6s9JcQ==
    caps: [mon] allow profile bootstrap-mgr
client.bootstrap-osd
    key: AQBhbJdbKAfFGRAACyKbfDP1V0Ub92Pw4aU8qQ==
    caps: [mon] allow profile bootstrap-osd
client.bootstrap-rgw
    key: AQBibJdbfcXxExAAU3Ujlajuu8Pj2vT+f9rAoQ==
    caps: [mon] allow profile bootstrap-rgw
mgr.controller01_mgr
    key: AQApcJdbjzjkFBAAOz8BodoKJzI1iMeKKwksfQ==
    caps: [mds] allow *
    caps: [mon] allow profile mgr
    caps: [osd] allow *
mgr.controller02_mgr
    key: AQAqcJdbaIG5MxAA5+CM7MfiMC/dlkE6NqIdkw==
    caps: [mds] allow *
    caps: [mon] allow profile mgr
    caps: [osd] allow *
mgr.controller03_mgr
    key: AQAscJdbYtGtHhAAhmcV1PgTHQPffEnWV2Umfg==
    caps: [mds] allow *
    caps: [mon] allow profile mgr
    caps: [osd] allow *

  十二)创建osd(存储)

  1、创建osd
    1、添加完磁盘,存储节点查看

  osd位于存储节点,可查看存储节点磁盘状况(磁盘直接添加上即可,不用分区格式化),以compute01节点为例

$ lsblk
NAME        MAJ:MIN RM  SIZE RO TYPE MOUNTPOINT
fd0           2:0    1    4K  0 disk 
sda           8:0    0   80G  0 disk 
├─sda1        8:1    0    1G  0 part /boot
├─sda2        8:2    0   19G  0 part 
│ ├─cl-root 253:0    0   77G  0 lvm  /
│ └─cl-swap 253:1    0    2G  0 lvm  [SWAP]
└─sda3        8:3    0   60G  0 part 
  └─cl-root 253:0    0   77G  0 lvm  /
sdb           8:16   0   50G  0 disk 
└─sdb1        8:17   0   50G  0 part /opt
sdc           8:32   0   10G  0 disk 
sdd           8:48   0   16G  0 disk 
sde           8:64   0   16G  0 disk 
sr0          11:0    1 1024M  0 
    2、创建osd

  实际创建osd时,可通过管理节点使用ceph-deploy创建;本例中有3个osd节点,每个osd节点可运行3个osd进程(在6800~7300端口范围内,每进程监听1个本地端口)

ceph-deploy osd create compute01 --data /dev/sdc
ceph-deploy osd create compute01 --data /dev/sdd
ceph-deploy osd create compute01 --data /dev/sde

ceph-deploy osd create compute02 --data /dev/sdc
ceph-deploy osd create compute02 --data /dev/sdd
ceph-deploy osd create compute02 --data /dev/sde

  创建成功如下图

  

  2、查看osd状态
    1、在管理节点操作

  查看osd列表

$ ceph-deploy osd list compute01

ceph-deploy osd list compute01的运行结果

  在管理节点查看osd状态等

[cephde@controller01 cephcluster]$ sudo ceph osd stat
6 osds: 6 up, 6 in
[cephde@controller01 cephcluster]$ sudo ceph osd tree
ID CLASS WEIGHT  TYPE NAME          STATUS REWEIGHT PRI-AFF 
-1       0.08197 root default                               
-3       0.04099     host compute01                         
 0   hdd 0.00980         osd.0          up  1.00000 1.00000 
 1   hdd 0.01559         osd.1          up  1.00000 1.00000 
 2   hdd 0.01559         osd.2          up  1.00000 1.00000 
-5       0.04099     host compute02                         
 3   hdd 0.00980         osd.3          up  1.00000 1.00000 
 4   hdd 0.01559         osd.4          up  1.00000 1.00000 
 5   hdd 0.01559         osd.5          up  1.00000 1.00000 

  在管理节点查看容量及使用情况

$ sudo ceph df
GLOBAL:
    SIZE        AVAIL       RAW USED     %RAW USED 
    84.0GiB     78.0GiB      6.02GiB          7.17 
POOLS:
    NAME     ID     USED     %USED     MAX AVAIL     OBJECTS 
    2、在存储节点操作

  在osd(存储)节点查看

$ lsblk
NAME                                                                                                  MAJ:MIN RM  SIZE RO TYPE MOUNTPOINT
fd0                                                                                                     2:0    1    4K  0 disk 
sda                                                                                                     8:0    0   80G  0 disk 
├─sda1                                                                                                  8:1    0    1G  0 part /boot
├─sda2                                                                                                  8:2    0   19G  0 part 
│ ├─cl-root                                                                                           253:0    0   77G  0 lvm  /
│ └─cl-swap                                                                                           253:1    0    2G  0 lvm  [SWAP]
└─sda3                                                                                                  8:3    0   60G  0 part 
  └─cl-root                                                                                           253:0    0   77G  0 lvm  /
sdb                                                                                                     8:16   0   50G  0 disk 
└─sdb1                                                                                                  8:17   0   50G  0 part /opt
sdc                                                                                                     8:32   0   10G  0 disk 
└─ceph--693dac4c--5d8c--4c94--aa6e--8e7360eb3dcc-osd--block--cba9c3bc--f75b--4bc7--93e4--5e262dd891f4 253:2    0   10G  0 lvm  
sdd                                                                                                     8:48   0   16G  0 disk 
└─ceph--9a7db77c--f52a--4403--a1a4--2287cf024cee-osd--block--83583e83--a824--41c5--9d54--6529b0dca943 253:3    0   16G  0 lvm  
sde                                                                                                     8:64   0   16G  0 disk 
└─ceph--bdd65160--4a3a--45ca--a416--edc4151717ab-osd--block--c1f6b583--61d4--4659--8d06--bb9d929e82cb 253:4    0   16G  0 lvm  
sr0                                                                                                    11:0    1 1024M  0 rom  

  ceph-osd进程,根据启动顺序,每个osd进程有特定的序号

systemctl status ceph-osd@0

  

  osd进程端口号;

ps aux | grep osd
netstat -tunlp | grep osd

  

  十三)登陆mgr_dashboard

  浏览器输入:http://10.20.9.189:7000

  1、默认的主页

  

  2、Cluster菜单
    1、servers

  

    2、OSD

  

    3、、Configuration Options

  

   3、Block

  

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值