create new cgroup
该过程就是mkdir/cgroup/cpu/test_cpu:在一个/cgroup/cpu hierarchy上创建一个cgroup,下面的bt是创建一个cpu hierarchy下的cgroup:
- mkdir /cgroup/cpu/test_cpu
- 74447177 8388 (mkdir) call trace:
- 0xffffffff8105fe80 : cpu_cgroup_create+0x0/0x40[kernel]
- 0xffffffff810c1021 :cgroup_mkdir+0x161/0x540 [kernel]
- 0xffffffff811850a7 :vfs_mkdir+0xa7/0x100 [kernel]
- 0xffffffff8118816e :sys_mkdirat+0xfe/0x120 [kernel]
- 0xffffffff811881a8 : sys_mkdir+0x18/0x20[kernel]
- 0xffffffff8100b0f2 :system_call_fastpath+0x16/0x1b [kernel]
- for_each_subsys(root, ss) {
- struct cgroup_subsys_state*css = ss->create(ss, cgrp);
- init_cgroup_css(css, ss,cgrp);
- …
- }
cpu_cgroup_create最终会通过sched_create_group(继承父cgroup)来生成一个task_group(即cpu子系统的group控制体结构),它包含了该cgroup的se,cfs_rq,shares等(在介绍cpu子系统的时候,我们再详细讨论)。
创建完成cgroup_subsys_state后就是生成该目录cgroup_create_dir,及生成子系统的文件cgroup_populate_dir:
- 74447240 8388 (mkdir) call trace:
- 0xffffffff81054e60 :cpu_cgroup_populate+0x0/0x30 [kernel]
- 0xffffffff810c007a :cgroup_populate_dir+0x7a/0x110 [kernel]
- 0xffffffff810c11fc : cgroup_mkdir+0x33c/0x540[kernel]
- 0xffffffff811850a7 :vfs_mkdir+0xa7/0x100 [kernel]
- 0xffffffff8118816e :sys_mkdirat+0xfe/0x120 [kernel]
- 0xffffffff811881a8 : sys_mkdir+0x18/0x20[kernel]
- 0xffffffff8100b0f2 :system_call_fastpath+0x16/0x1b [kernel]
简而言之,该过程完成cgroup结构的创建包括该cgroup所属的所有子系统的cgroup_subsys_state,然后相应的目录及文件,并把这些文件与该cgroup绑定起来。这里并没有建立css_set与该cgroup的关系,因为mkdir时该cgroup还没有attach任何进程,所以也不会有css_set与它有关系。
=====================================
该过程对应于我们上面的实例操作的:echo 512 > tasks的过程,其实质就是先对cgroup下tasks文件进行写操作,建立该进程新的css_set与所有管理它的cgroup的关系;然后再根据各个子系统自己的attach函数进行attach操作。在这里我们先介绍第一个过程,第二个过程在各个子系统中介绍。先看一下bt:
- 12530 (sh) cpu_cgroup_attach call trace:
- 0xffffffff81065a20 :cpu_cgroup_attach+0x0/0x60 [kernel]
- 0xffffffff810c1d3e :cgroup_attach_task+0x26e/0x620 [kernel]
- 0xffffffff810c214c :cgroup_tasks_write+0x5c/0xf0 [kernel]
- 0xffffffff810be29a :cgroup_file_write+0x2ba/0x320 [kernel]
- 0xffffffff81177e68 :vfs_write+0xb8/0x1a0 [kernel]
- 0xffffffff81178871 : sys_write+0x51/0x90[kernel]
- 0xffffffff8100b0f2 :system_call_fastpath+0x16/0x1b [kernel]
- if (css == &init_css_set) {
- res = &root->top_cgroup;
- } else {
- struct cg_cgroup_link *link;
- /*因为css_set会被多个cgroup管理,但是这些cgroup都是属于不同的hierarchy,所以当遍历到一个cgroup它的root等于当前的hierarchy,那么这个cgroup就是该task在该hierarchy下当前所属的cgroup*/
- list_for_each_entry(link, &css->cg_links, cg_link_list) {
- struct cgroup *c = link->cgrp;
- if (c->root == root) {
- res = c;
- break;
- }
- }
- }
如果要attach的新的cgroup与该task之前在该 hierarchy所属的cgroup一样则直接返回;否则,先判断该task是否可以在所有subsys上can_attach,然后通过find_css_set查找一个已经存在的css_set或者创建一个新的:首先通过find_existing_css_set查找是否有一个可用的css_set( 从css_set_table哈希表中查出与该task旧的css_set所属的子系统+新的子系统相同的css_set链表,然后遍历这个链表的每个node与旧的css_set所关联的cgroup是否一样(compare_css_sets,除去新的将要attach的cgroup),其实质就是查找是否存在这样一个css_set:该task旧的css_set的所有cgroup去掉它在当前hierarchy下的cgroup,加上新的它即将加入的cgroup,组成的css_set),有则直接返回;否则,创建一个新的css_set,并且建立新的css_set(res)与该task之前旧的css_set(oldcg)的所有关联的cgroup(其实也是root_count个 hierarchy,因为在每个hierarchy下都有一个cgroup与之相关,除去它之前所属的cgroup)的关系,再把该新的css_set加入到哈希表hlist。最后再调用每个子系统的attach,即第二个过程。
下面的图3(来自http://blog.chinaunix.net/uid-20543183-id-1930840.html),展现了我们前面介绍的三个过程mount,mkdir,attach:
其中task结构里的字段是错误的,应该是:cgroups,cg_list(在2.6.32-220 kernel)。它mount一个由两个subsys组成的hierarchy。到这里我们就介绍了cgroup框架里mount,mkdir,attach三个操作,后面我们将介绍cgroup的子系统。