Docker-Cgroup资源配置

最新推荐文章于 2024-08-14 23:19:00 发布

茄子啊

最新推荐文章于 2024-08-14 23:19:00 发布

阅读量499

点赞数

分类专栏： Docker 文章标签： docker

本文链接：https://blog.csdn.net/weixin_49780168/article/details/114915818

版权

Docker 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

一、Cgroup概述

为什么要做资源分配？

容器和虚拟机的区别：
虚拟机不需要做，因为虚拟机在创建的时候已经做了资源分配（配额），（虚拟CPU,虚拟内存,虚拟磁盘等）
而容器共享内核资源，所以需要做Cgroup，可以按照往年监控的数据，查看cpu等资源的耗用情况来进行分配

Cgroup介绍

Docker通过 Cgroup 来控制容器使用的资源配额，包括 CPU、内存、磁盘三大方面，基本覆盖了常见的资源配额和使用量控制。
Cgroup 是 Control Groups 的缩写，是Linux 内核提供的一种可以限制、记录、隔离进程组所使用的物理资源(如 CPU、内存、磁盘 IO 等等)的机制，被 LXC、docker 等很多项目用于实现进程资源控制。Cgroup 本身是提供将进程进行分组化管理的功能和接口的基础结构，I/O 或内存的分配控制等具体的资源管理是通过该功能来实现的。
这些具体的资源管理功能称为 Cgroup 子系统，有以下几大子系统实现：

子系统	功能
blkio	设置限制每个块设备的输入输出控制。例如:磁盘，光盘以及 usb 等等。
CPU	使用调度程序为 cgroup 任务提供 CPU 的访问。
cpuacct	产生 cgroup 任务的 CPU 资源报告。
cpuset	如果是多核心的 CPU，这个子系统会为 cgroup 任务分配单独的 CPU 和内存。
devices	允许或拒绝 cgroup 任务对设备的访问。
freezer	暂停和恢复 cgroup 任务。
memory	设置每个 cgroup 的内存限制以及产生内存资源报告。
net_cls	标记每个网络包以供 cgroup 方便使用。
ns	命名空间子系统。
perf_event	增加了对每个 group 的监测跟踪的能力，可以监测属于某个特定的 group 的所有线程以及运行在特定CPU上的线程。

Cgroup 特点

在 cgroups 中，任务就是系统的一个进程。

制族群（control group）。控制族群就是一组按照某种标准划分的进程。Cgroups
中的资源控制都是以控制族群为单位实现。一个进程可以加入到某个控制族群，也从一个进程组迁移到另一个控制族群。一个进程组的进程可以使用
cgroups 以控制族群为单位分配的资源，同时受到 cgroups 以控制族群为单位设定的限制。
层级（hierarchy）。控制族群可以组织成 hierarchical
的形式，既一颗控制族群树。控制族群树上的子节点控制族群是父节点控制族群的孩子，继承父控制族群的特定的属性。
子系统（subsytem）。一个子系统就是一个资源控制器，比如 cpu 子系统就是控制 cpu
时间分配的一个控制器。子系统必须附加（attach）到一个层级上才能起作用，一个子系统附加到某个层级以后，这个层级上的所有控制族群都受到这个子系统的控制。

二、docker容器资源配置

使用 stress 工具测试 CPU 和内存

使用 Dockerfile 来创建一个基于 Centos 的 stress 工具镜像。

[root@localhost ~]# mkdir /opt/stress
[root@localhost ~]# vim /opt/stress/Dockerfile
FROM centos:7
MAINTAINER qi
RUN yum install -y wget
RUN wget -O /etc/yum.repos.d/epel.repo http://mirrors.aliyun.com/repo/epel-7.repo
RUN yum install -y stress

[root@localhost ~]# cd /opt/stress/
[root@localhost stress]# docker build -t centos:stress .

使用如下命令创建容器，命令中的–cpu-shares 参数值不能保证可以获得 1 个 vcpu 或者多少 GHz 的 CPU 资源，它仅是一个弹性的加权值。
[root@localhost stress]# docker run -itd --cpu-shares 100 centos:stress

容器的cpu权重控制

默认情况下，每个 Docker容器的CPU份额都是1024。单独一个容器的份额是没有意义的。只有在同时运行多个容器时，容器的 CPU 加权的效果才能体现出来。

例如，两个容器 A、B 的 CPU 份额分别为 1000 和 500，在CPU进行时间片分配的时候，容器A比容器B多一倍的机会获得 CPU 的时间片。
但分配的结果取决于当时主机和其他容器的运行状态，实际上也无法保证容器 A一定能获得CPU时间片。比如容器A的进程一直是空闲的，
那么容器B是可以获取比容器A更多的CPU时间片的。极端情况下，例如主机上只运行了一个容器，即使它的 CPU 份额只有 50，它也可以独占整个主机的CPU资源。

Cgroups 只在容器分配的资源紧缺时，即在需要对容器使用的资源进行限制时，才会生效。因此，无法单纯根据某个容器的CPU份额来确定有多少CPU资源分配给它，
资源分配结果取决于同时运行的其他容器的CPU分配和容器中进程运行情况。
可以通过 cpu share 可以设置容器使用 CPU 的优先级，比如启动了两个容器及运行查看 CPU 使用百分比。

[root@localhost stress]# docker run -tid --name cpu512 --cpu-shares 512 centos:stress stress -c 10   //容器产生10个子函数进程

//--cpu-shares 指定使用cpu的权重
//stress -c 指定产生子进程的个数

[root@localhost stress]# docker exec -it 20d8f1a6055d bash  //进入容器使用top查看cpu使用情况
[root@20d8f1a6055d /]# top
top - 03:10:39 up  8:24,  0 users,  load average: 19.91, 13.06, 5.87
Tasks:  13 total,  11 running,   2 sleeping,   0 stopped,   0 zombie
%Cpu(s):100.0 us,  0.0 sy,  0.0 ni,  0.0 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
KiB Mem :  7990280 total,  5897572 free,   466692 used,  1626016 buff/cache
KiB Swap:  8257532 total,  8257532 free,        0 used.  7226596 avail Mem 

   PID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND                                                 
    13 root      20   0    7312     92      0 R  15.0  0.0   1:30.11 stress                                                  
    16 root      20   0    7312     92      0 R  14.6  0.0   1:28.64 stress                                                  
     9 root      20   0    7312     92      0 R  14.3  0.0   1:30.19 stress                                                  
    14 root      20   0    7312     92      0 R  14.3  0.0   1:28.37 stress                                                  
    15 root      20   0    7312     92      0 R  14.3  0.0   1:29.61 stress                                                  
     8 root      20   0    7312     92      0 R  14.0  0.0   1:29.97 stress                                                  
    11 root      20   0    7312     92      0 R  14.0  0.0   1:28.89 stress                                                  
    17 root      20   0    7312     92      0 R  13.3  0.0   1:29.03 stress                                                  
    10 root      20   0    7312     92      0 R  12.0  0.0   1:27.46 stress                                                  
    12 root      20   0    7312     92      0 R  12.0  0.0   1:28.49 stress                                                  
    37 root      20   0   56192   2000   1440 R   0.3  0.0   0:00.03 top                                                     
     1 root      20   0    7312    624    532 S   0.0  0.0   0:00.03 stress                                                  
    23 root      20   0   11828   1892   1492 S   0.0  0.0   0:00.05 bash 

//再开启一个容器做比较
[root@localhost stress]# docker run -tid --name cpu1024 --cpu-shares 1024 centos:stress stress -c 10
[root@localhost stress]# docker exec -it c9fb81a3716f bash
[root@c9fb81a3716f /]# top
top - 03:13:14 up  8:27,  0 users,  load average: 20.14, 15.93, 8.06
Tasks:  13 total,  11 running,   2 sleeping,   0 stopped,   0 zombie
%Cpu(s):100.0 us,  0.0 sy,  0.0 ni,  0.0 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
KiB Mem :  7990280 total,  5897604 free,   466656 used,  1626020 buff/cache
KiB Swap:  8257532 total,  8257532 free,        0 used.  7226632 avail Mem 

   PID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND                                                 
    12 root      20   0    7312    100      0 R  28.6  0.0   1:50.01 stress                                                  
    15 root      20   0    7312    100      0 R  28.6  0.0   1:49.06 stress                                                  
     8 root      20   0    7312    100      0 R  27.2  0.0   1:47.32 stress                                                  
    16 root      20   0    7312    100      0 R  27.2  0.0   1:46.78 stress                                                  
     7 root      20   0    7312    100      0 R  26.9  0.0   1:50.37 stress                                                  
     9 root      20   0    7312    100      0 R  26.6  0.0   1:48.75 stress                                                  
    14 root      20   0    7312    100      0 R  25.2  0.0   1:49.29 stress                                                  
    10 root      20   0    7312    100      0 R  24.9  0.0   1:48.01 stress                                                  
    11 root      20   0    7312    100      0 R  24.9  0.0   1:48.43 stress                                                  
    13 root      20   0    7312    100      0 R  24.6  0.0   1:46.27 stress                                                  
     1 root      20   0    7312    632    532 S   0.0  0.0   0:00.03 stress                                                  
    23 root      20   0   11828   1888   1488 S   0.0  0.0   0:00.02 bash                                                    
    38 root      20   0   56192   2000   1440 R   0.0  0.0   0:00.00 top     

//进容器使用top对比两个容器的%CPU，比例是1:2

CPU 周期限制

Docker 提供了–cpu-period、–cpu-quota 两个参数控制容器可以分配到的 CPU 时钟周期。
–cpu-period 是用来指定容器对 CPU 的使用要在多长时间内做一次重新分配。

–cpu-quota 是用来指定在这个周期内，最多可以有多少时间用来跑这个容器。
与 --cpu-shares 不同的是,这种配置是指定一个绝对值，容器对 CPU 资源的使用绝对不会超过配置的值。

cpu-period 和 cpu-quota 的单位为微秒（μs）。cpu-period 的最小值为 1000 微秒，最大值为 1 秒（10^6 μs），默认值为 0.1 秒（100000 μs）。
cpu-quota 的值默认为 -1，表示不做控制。cpu-period 和 cpu-quota 参数一般联合使用。

例如：容器进程需要每 1 秒使用单个 CPU 的 0.2 秒时间，可以将 cpu-period 设置为 1000000（即 1 秒），cpu-quota 设置为 200000（0.2 秒）。
当然，在多核情况下，如果允许容器进程完全占用两个 CPU，则可以将 cpu-period 设置为 100000（即 0.1 秒）， cpu-quota 设置为 200000（0.2 秒）。

[root@localhost stress]# docker run -tid --cpu-period 100000 --cpu-quota 200000 centos:stress
[root@localhost stress]# docker exec -it a19a905d2e7b bash
[root@a19a905d2e7b /]# cat /sys/fs/cgroup/cpu/cpu.cfs_period_us
100000
[root@a19a905d2e7b /]# cat /sys/fs/cgroup/cpu/cpu.cfs_quota_us
200000

CPU Core 控制

对多核 CPU 的服务器，Docker 还可以控制容器运行使用哪些 CPU 内核，即使用–cpuset-cpus 参数。
这对具有多 CPU 的服务器尤其有用，可以对需要高性能计算的容器进行性能最优的配置。

[root@localhost stress]# docker run -tid --name cpu1 --cpuset-cpus 0-1 centos:stress

执行以上命令需要宿主机为双核，表示创建的容器只能用 0、1两个内核。最终生成的 cgroup 的 CPU 内核配置如下：

[root@localhost stress]# docker exec -it dc0589a40d0c bash
[root@dc0589a40d0c /]# cat /sys/fs/cgroup/cpuset/cpuset.cpus
0-1

通过下面指令可以看到容器中进程与 CPU 内核的绑定关系，达到绑定 CPU 内核的目的。

[root@localhost stress]# docker exec dc0589a40d0c taskset -c -p 1    //容器内部第一个进程号pid为1被绑定到指定CPU上运行
pid 1's current affinity list: 0,1

CPU 配额控制参数的混合使用

通过 cpuset-cpus 参数指定容器 A 使用 CPU 内核 0，容器 B 只是用 CPU 内核 1。
在主机上只有这两个容器使用对应 CPU 内核的情况，它们各自占用全部的内核资源，cpu-shares 没有明显效果。

cpuset-cpus、cpuset-mems 参数只在多核、多内存节点上的服务器上有效，并且必须与实际的物理配置匹配，否则也无法达到资源控制的目的。

在系统具有多个 CPU 内核的情况下，需要通过 cpuset-cpus 参数为设置容器 CPU 内核才能方便地进行测试。

//宿主系统修改为4核心CPU,先用docker rm -f删除其他容器
[root@localhost stress]# docker run -tid --name cpu3 --cpuset-cpus 1 --cpu-shares 512 centos:stress stress -c 1
[root@localhost stress]# docker exec -it 1026b27ecd2a bash
[root@localhost stress]# top   //记住按1查看每个核心的占用
top - 11:54:50 up  9:08,  2 users,  load average: 14.24, 19.10, 19.01
Tasks: 138 total,   2 running, 136 sleeping,   0 stopped,   0 zombie
%Cpu0  :  0.0 us,  0.3 sy,  0.0 ni, 99.7 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
%Cpu1  :100.0 us,  0.0 sy,  0.0 ni,  0.0 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
%Cpu2  :  0.0 us,  0.0 sy,  0.0 ni,100.0 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
%Cpu3  :  0.0 us,  0.3 sy,  0.0 ni, 99.7 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st

[root@localhost stress]# docker run -tid --name cpu4 --cpuset-cpus 3 --cpu-shares 1024 centos:stress stress -c 1
[root@localhost stress]# top   //记住按1查看每个核心的占用
Tasks: 172 total,   2 running, 170 sleeping,   0 stopped,   0 zombie
%Cpu0  :  0.0 us,  0.0 sy,  0.0 ni,100.0 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
%Cpu1  :  0.0 us,  0.0 sy,  0.0 ni,100.0 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
%Cpu2  :  0.0 us,  0.0 sy,  0.0 ni,100.0 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
%Cpu3  :100.0 us,  0.0 sy,  0.0 ni,  0.0 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
KiB Mem :  7994072 total,  6394056 free,   450124 used,  1149892 buff/cache
KiB Swap:  4194300 total,  4194300 free,        0 used.  7174064 avail Mem 
[root@localhost stress]# docker exec -it 0eed2c8a20df bash

总结：上面的 centos:stress 镜像安装了 stress 工具，用来测试 CPU 和内存的负载。通过在两个容器上分别执行 stress -c 1 命令，
将会给系统一个随机负载，产生 1 个进程。这个进程都反复不停的计算由 rand() 产生随机数的平方根，直到资源耗尽。
观察到宿主机上的 CPU 使用率，第三个内核的使用率接近 100%，并且一批进程的 CPU 使用率明显存在 2:1 的使用比例的对比。

内存限额

与操作系统类似，容器可使用的内存包括两部分：物理内存和 Swap。
Docker 通过下面两组参数来控制容器内存的使用量。

-m 或 --memory：设置内存的使用限额，例如 100M、1024M。
–memory-swap：设置内存+swap 的使用限额。
执行如下命令允许该容器最多使用 200M 的内存和 300M 的 swap。

[root@localhost stress]# docker run -it -m 200M --memory-swap=300M progrium/stress --vm 1 --vm-bytes 280M

//--vm 1：启动 1 个内存工作线程。 
//--vm-bytes 280M：每个线程分配 280M 内存。

默认情况下，容器可以使用主机上的所有空闲内存。
与 CPU 的 cgroups 配置类似， Docker 会自动为容器在目录 /sys/fs/cgroup/memory/docker/<容器的完整长 ID>
中创建相应 cgroup 配置文件

如果让工作线程分配的内存超过 300M，分配的内存超过限额，stress 线程报错，容器退出。

[root@localhost stress]# docker run -it -m 200M --memory-swap=300M progrium/stress --vm 1 --vm-bytes 310M

stress: info: [1] dispatching hogs: 0 cpu, 0 io, 1 vm, 0 hdd
stress: dbug: [1] using backoff sleep of 3000us
stress: dbug: [1] --> hogvm worker 1 [6] forked
stress: dbug: [6] allocating 325058560 bytes ...
stress: dbug: [6] touching bytes in strides of 4096 bytes ...
stress: FAIL: [1] (416) <-- worker 6 got signal 9
stress: WARN: [1] (418) now reaping child worker processes
stress: FAIL: [1] (422) kill error: No such process
stress: FAIL: [1] (452) failed run completed in 0s

Block IO 的限制

默认情况下，所有容器能平等地读写磁盘，可以通过设置–blkio-weight 参数来改变容器 block IO 的优先级。
–blkio-weight 与 --cpu-shares 类似，设置的是相对权重值，默认为 500。
在下面的例子中，容器 A 读写磁盘的带宽是容器 B 的两倍。

[root@localhost docker]# docker run -it --name container_A --blkio-weight 600 centos:stress
[root@2e251d0849ae /]# cat /sys/fs/cgroup/blkio/blkio.weight
600

[root@localhost docker]# docker run -it --name container_B --blkio-weight 300 centos:stress
[root@c52ba5bd94ee /]# cat /sys/fs/cgroup/blkio/blkio.weight
300

bps 和 iops 的限制

bps 是 byte per second，每秒读写的数据量。
iops 是 io per second，每秒 IO 的次数。
可通过以下参数控制容器的 bps 和 iops：

–device-read-bps，限制读某个设备的 bps。
–device-write-bps，限制写某个设备的 bps。
–device-read-iops，限制读某个设备的 iops。
–device-write-iops，限制写某个设备的 iops。

下面的示例是限制容器写 /dev/sda 的速率为 5 MB/s。

[root@localhost docker]# docker run -it --device-write-bps /dev/sda:5MB centos:stress

[root@ff500949a25e /]# dd if=/dev/zero of=test bs=1M count=1024 oflag=direct   //可以按ctrl+c中断查看
906+0 records in
906+0 records out
950009856 bytes (950 MB) copied, 181.202 s, 5.2 MB/s

通过 dd 命令测试在容器中写磁盘的速度。因为容器的文件系统是在 host /dev/sda 上的，
在容器中写文件相当于对 host /dev/sda 进行写操作。另外，oflag=direct 指定用 direct IO 方式写文件，
这样 --device-write-bps 才能生效。

结果表明限速 5MB/s 左右。作为对比测试，如果不限速，结果如下。

[root@localhost docker]# docker run -it centos:stress

[root@10531445df8d /]# dd if=/dev/zero of=test bs=1M count=1024 oflag=direct
1024+0 records in
1024+0 records out
1073741824 bytes (1.1 GB) copied, 0.928611 s, 1.2 GB/s