进程—内存描述符(mm_struct)

转自:进程—内存描述符(mm_struct)_宇哲-CSDN博客_mm_struct,部分内容修改

前言

        上一篇我们谈论了task_struct这个结构体,它被叫做进程描述符,内部成员包含了很多与进程相关的信息,今天我们来看一下其中一个被叫做内存描述符的结构体——mm_struct,用来描述linux下进程的地址空间的所有的信息。

1.概述

        一个进程的虚拟地址空间主要由两个数据结来描述。一个是最高层次的:mm_struct,一个是较高层次的:vm_area_structs。最高层次的mm_struct结构描述了一个进程的整个虚拟地址空间。较高层次的结构vm_area_truct描述了虚拟地址空间的一个区间。每个进程只有一个mm_struct结构,在每个进程的task_struct结构中,有一个指向该进程的结构。可以说,mm_struct结构是对整个用户空间的描述。

        首先,我们来定位mm_struct文件所在位置和task_struct所在路径是一样的,不过他们所在文件是不一样的,mm_struct所在的文件是mm_types.h,接下来我们就来分析这个结构好了。

首先我们来看下这个:


这就是我们所说的由task_struct到mm_struct,进程的地址空间的分布。

 

        每一个进程都会有自己独立的mm_struct,这样每一个进程都会有自己独立的地址空间,这样才能互不干扰。当进程之间的地址空间被共享的时候,我们可以理解为这个时候是多个进程使用一份地址空间,这就是线程。

        其实多个进程的地址空间分布就是上面这张图一样,每一个进程的用户空间在32位的平台上就是上面这个图的情况,对于物理内存当中的内核kernel,是只存在一份,所有的进程是用来共享的,内核当中会利用PCB(进程控制块)来管理不同的进程。对于linux的体系结构来说,linux当中为了保护虚拟内核空间不被修改,所以linux体系结构是这样的:

        这种三层的体系结构,保证进程只能对最外面的应用程序进行修改,保证了内存的安全性。

        另外,我们从第一张图上可以发现,每个区域是依靠着两个指针进行维护的,比如[start_data,end_data)是用来维护data段,[start_code,end_data)用来维护code段,[start_brk,brk),用来维护heap和heap的指针。[start_stack,end_stack)是用来维护stack段空间范围。mmap_base是维护共享映射区的起始地址。bss段表示的是所有的未初始化的全局变量,为了效率,对处在bss段的变量,将它们匿名映射到“零页”,这样提高了程序的加载效率。

    //指向线性区对象的链表头
    struct vm_area_struct * mmap;       /* list of VMAs */
    //指向线性区对象的红黑树
    struct rb_root mm_rb;

        在地址空间中,mmap为地址空间的内存区域(用vm_area_struct结构来表示)链表,mm_rb用红黑树来存储,链表表示起来更加方便,红黑树表示起来更加方便查找。区别是,当虚拟区较少的时候,这个时候采用单链表,由mmap指向这个链表,当虚拟区多时此时采用红黑树的结构,由mm_rb指向这棵红黑树。这样就可以在大量数据的时候效率更高。所有的mm_struct结构体通过自身的mm_list域链接在一个双向链表上,该链表的首元素是init_mm内存描述符,代表init进程的地址空间。

    atomic_t mm_users;      
    atomic_t mm_count;

这两个内容表示的各有不同。

成员内容
mm_users进程数量值(在多线程的情况下尤为适用)
mm_count引用计数(当计数为0的时候表示没有再被使用)

使用mm_users和mm_count两个计数器是为了区别主使用计数器和使用该地址空间的进程的数目。

每一个进程都可以被别的进程来共享,也就是和别的进程来共享mm_struct.

所有的mm_struct结构以链表的形式存在mm_struct的。

        另外需要说明的就是kernel线程是没有地址空间的,也就没有对应的mm_struct,kernel线程使用之前运行的进程的内存描述符。

        程序中通常用到的地址常常具有局部性,当前最近一次用蛋糕的虚拟地址区间很可能下一次还是需要用到,所以我们采用局部性原理,通常时候我们去吧当前地址周围一个区间的内存放入高速缓存当中,这个区间在mm_struct当中就是由mmap_cache来维护。

2.关于页表

        linux kernel 使用内存管理的时候,采取的是页式的管理方式,应用程序给出的内存地址是虚拟地址,是经过若干层的页表的转换才能得到真正的物理地址,所以相对来说,进程的地址空间是一份虚拟的地址空间,每一个地址通过页表的转换映射到所谓的物理地址空间上。在这里所共享的1G的kernel在内存地址是只存一份的,但是对于每一个进程其他的3G的空间,是存储其他不同的东西,另外,页表具有权限限定,这样也就提供给了每块内存区域,比如我定义了:

char * p="12342";

这里的“12342”是一个常量字符串,它被存放在只读常量存储区,所以这个区域的页表的属性就是只读,这样就可以高效的维护整个进程的地址空间。

每一个进程都会有一个进程描述符,task_struct,task_strust当中的mm指针指向每个进程的内存描述符,而对于每个mm,有都会有单独的页表,

pgt区间是用来维护页表的目录,每一个进程的都有自己的页表目录,需要注意进程的页目录和内核的页目录是不一样的,当程序调度器调度程序运行的时候,这个时候这个地址就会转换成为物理地址,linux一般采用三级页表进行转换。

3.task_struct和mm_strcuct的联系
不知道你是否还记得在task_struct当中的

    //关于进程的地址空间,指向进程的地址空间。(链表和红黑树)
    struct mm_struct *mm, *active_mm;

ask_struct和mm_strcut通过这两个成员进行和mm_struct联系,每一个进程都会有唯一的mm_struct结构体。




struct mm_struct {

    //指向线性区对象的链表头
    struct vm_area_struct * mmap;       /* list of VMAs */
    //指向线性区对象的红黑树
    struct rb_root mm_rb;
    //指向最近找到的虚拟区间
    struct vm_area_struct * mmap_cache; /* last find_vma result */

    //用来在进程地址空间中搜索有效的进程地址空间的函数
    unsigned long (*get_unmapped_area) (struct file *filp,
                unsigned long addr, unsigned long len,
                unsigned long pgoff, unsigned long flags);

       unsigned long (*get_unmapped_exec_area) (struct file *filp,
                unsigned long addr, unsigned long len,
                unsigned long pgoff, unsigned long flags);

    //释放线性区时调用的方法,          
    void (*unmap_area) (struct mm_struct *mm, unsigned long addr);

    //标识第一个分配文件内存映射的线性地址
    unsigned long mmap_base;        /* base of mmap area */


    unsigned long task_size;        /* size of task vm space */
    /*
     * RHEL6 special for bug 790921: this same variable can mean
     * two different things. If sysctl_unmap_area_factor is zero,
     * this means the largest hole below free_area_cache. If the
     * sysctl is set to a positive value, this variable is used
     * to count how much memory has been munmapped from this process
     * since the last time free_area_cache was reset back to mmap_base.
     * This is ugly, but necessary to preserve kABI.
     */
    unsigned long cached_hole_size;

    //内核进程搜索进程地址空间中线性地址的空间空间
    unsigned long free_area_cache;      /* first hole of size cached_hole_size or larger */

    //指向页表的目录
    pgd_t * pgd;

    //共享进程时的个数
    atomic_t mm_users;          /* How many users with user space? */

    //内存描述符的主使用计数器,采用引用计数的原理,当为0时代表无用户再次使用
    atomic_t mm_count;          /* How many references to "struct mm_struct" (users count as 1) */

    //线性区的个数
    int map_count;              /* number of VMAs */

    struct rw_semaphore mmap_sem;

    //保护任务页表和引用计数的锁
    spinlock_t page_table_lock;     /* Protects page tables and some counters */

    //mm_struct结构,第一个成员就是初始化的mm_struct结构,
    struct list_head mmlist;        /* List of maybe swapped mm's.  These are globally strung
                         * together off init_mm.mmlist, and are protected
                         * by mmlist_lock
                         */

    /* Special counters, in some configurations protected by the
     * page_table_lock, in other configurations by being atomic.
     */

    mm_counter_t _file_rss;
    mm_counter_t _anon_rss;
    mm_counter_t _swap_usage;

    //进程拥有的最大页表数目
    unsigned long hiwater_rss;  /* High-watermark of RSS usage */、
    //进程线性区的最大页表数目
    unsigned long hiwater_vm;   /* High-water virtual memory usage */

    //进程地址空间的大小,锁住无法换页的个数,共享文件内存映射的页数,可执行内存映射中的页数
    unsigned long total_vm, locked_vm, shared_vm, exec_vm;
    //用户态堆栈的页数,
    unsigned long stack_vm, reserved_vm, def_flags, nr_ptes;
    //维护代码段和数据段
    unsigned long start_code, end_code, start_data, end_data;
    //维护堆和栈
    unsigned long start_brk, brk, start_stack;
    //维护命令行参数,命令行参数的起始地址和最后地址,以及环境变量的起始地址和最后地址
    unsigned long arg_start, arg_end, env_start, env_end;

    unsigned long saved_auxv[AT_VECTOR_SIZE]; /* for /proc/PID/auxv */

    struct linux_binfmt *binfmt;

    cpumask_t cpu_vm_mask;

    /* Architecture-specific MM context */
    mm_context_t context;

    /* Swap token stuff */
    /*
     * Last value of global fault stamp as seen by this process.
     * In other words, this value gives an indication of how long
     * it has been since this task got the token.
     * Look at mm/thrash.c
     */
    unsigned int faultstamp;
    unsigned int token_priority;
    unsigned int last_interval;

    //线性区的默认访问标志
    unsigned long flags; /* Must use atomic bitops to access the bits */

    struct core_state *core_state; /* coredumping support */
#ifdef CONFIG_AIO
    spinlock_t      ioctx_lock;
    struct hlist_head   ioctx_list;
#endif
#ifdef CONFIG_MM_OWNER
    /*
     * "owner" points to a task that is regarded as the canonical
     * user/owner of this mm. All of the following must be true in
     * order for it to be changed:
     *
     * current == mm->owner
     * current->mm != mm
     * new_owner->mm == mm
     * new_owner->alloc_lock is held
     */
    struct task_struct *owner;
#endif

#ifdef CONFIG_PROC_FS
    /* store ref to file /proc/<pid>/exe symlink points to */
    struct file *exe_file;
    unsigned long num_exe_file_vmas;
#endif
#ifdef CONFIG_MMU_NOTIFIER
    struct mmu_notifier_mm *mmu_notifier_mm;
#endif
#ifdef CONFIG_TRANSPARENT_HUGEPAGE
    pgtable_t pmd_huge_pte; /* protected by page_table_lock */
#endif
    /* reserved for Red Hat */
#ifdef __GENKSYMS__
    unsigned long rh_reserved[2];
#else
    /* How many tasks sharing this mm are OOM_DISABLE */
    union {
        unsigned long rh_reserved_aux;
        atomic_t oom_disable_count;
    };

    /* base of lib map area (ASCII armour) */
    unsigned long shlib_base;
#endif
};

github注释源码链接:https://github.com/wsy081414/C_linux_practice/blob/master/mm_struct.c

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: task_struct 是一个结构体,包含了进程的各种信息,其中包括进程内存信息。要判断进程内存使用情况,可以使用如下的方法: 1. 使用 task_struct 结构体中的字段,如 mmmm->total_vm 等,来获取进程内存使用情况。 2. 使用系统调用 getrusage() 来获取进程内存使用情况,其中参数 RUSAGE_SELF 表示获取当前进程内存使用情况。 3. 使用 /proc 文件系统,在 /proc/[pid]/status 文件中可以获取进程内存使用情况。 4. 使用内存信息文件 /proc/meminfo,获取系统的内存使用情况,并根据进程进程号获取进程内存使用情况。 5. 使用工具如 top、ps 等,获取进程内存使用情况。 可以根据自己的需要来选择使用哪种方法,这里介绍的是一些常用的方法。 ### 回答2: task_structLinux 内核中用来表示进程的数据结构。它包含了进程的所有信息,包括进程状态、进程 ID、进程的父子关系、进程的独立地址空间等。通过访问 task_struct,我们可以判断进程内存使用情况。 task_struct 中包含了一个 mm_struct 结构体,它用来描述进程的地址空间信息。mm_struct 中的 field 指向了进程内存描述符 vma_struct,以及进程的页表等信息。通过访问 mm_struct,我们可以获取进程内存使用情况,比如进程的虚拟地址空间、实际占用的物理内存等。 当我们需要判断一个进程内存使用情况时,可以通过访问其 task_struct 结构体,然后进一步访问其中的 mm_struct 结构体来获取相关信息。例如,可以通过访问 mm_struct 中的 vma_struct 来获取进程内存映射情况,包括虚拟地址范围和权限等;还可以通过访问 mm_struct 中的 pgd 字段来获取进程的页表信息,以了解进程的物理内存使用情况。 总之,task_struct 提供了访问进程内存信息的接口,我们可以通过访问其中的 mm_struct 结构体来判断进程内存使用情况。这些信息对于我们理解和监控进程内存行为非常重要,也是优化进程内存占用的基础。 ### 回答3: task_struct是在Linux内核中定义的一个数据结构,用于表示一个进程的各种信息,包括进程的状态、内存分配和管理等。 判断进程内存的方式主要通过task_struct中的成员变量来完成。首先,我们可以使用task_struct中的mm成员变量来判断进程内存空间是否存在。mm指向了一个mm_struct结构体对象,该对象表示进程内存管理信息。如果mm为空,则说明该进程没有分配内存空间,即没有占用实际的物理内存。 其次,我们可以通过task_struct中的rss成员变量来判断进程占用的物理内存大小。rss表示进程的常驻集大小,即实际分配给进程的物理内存页面数量。通过判断rss的数值,我们可以间接判断进程所占用的物理内存大小。 此外,task_struct还包含了其他与内存相关的成员变量,如start_code和end_code表示进程的代码段起始地址和结束地址,start_data和end_data表示进程的数据段起始地址和结束地址,start_brk和brk表示进程的堆起始地址和当前堆指针位置等。通过这些成员变量的值,我们可以判断进程所使用的内存区域和大小。 综上所述,通过对task_struct中的成员变量进行分析和判断,我们可以得出进程是否分配内存、占用物理内存的大小和所使用的内存区域等信息,以判断进程内存状态。这对于Linux内核对进程内存管理和资源分配非常重要。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值