关于linux下协程的通用实现及libtask库源码解析

最新推荐文章于 2024-02-28 23:02:06 发布

weixin_abctee123

最新推荐文章于 2024-02-28 23:02:06 发布

阅读量528

点赞数

分类专栏：老文章迁移文章标签： linux

本文链接：https://blog.csdn.net/weixin_60223182/article/details/128641750

版权

本文探讨了协程与子例程的区别，强调协程的对等关系和独立堆栈。通过分析，指出实现协程需要全局调度器和独立堆栈。在Linux环境下，利用glibc的getcontext、setcontext等函数可以实现用户态的上下文切换，进而构建协程系统。libtask是一个基于这些函数的协程库，通过任务调度器实现任务的切换。文章详细解析了libtask的实现机制，并讨论了栈空间管理以及如何判断栈空间是否足够的技巧。

摘要由CSDN通过智能技术生成

协程(coroutine)与subroutine同样作为程序执行单元的抽象被一些语言当作基础实现,两者的抽象方式大致区别在于：

多个执行单元之间的关系：

对于subroutine来说,存在一个调用与被调用的关系,比如在a-subroutine里调用 b-subroutine, 那么a-subroutine就是调用者,b-subroutine是被调用者,它们共享一个线程的堆栈.

而多个coroutine之间的关系是对等的,即便在a-coroutine里创建了 b-coroutine,他们之间也不会有任何层级关系.

subroutine作为一种通用的抽象比较容易实现,而要实现coroutine至少需要两个条件:

要有一个全局的调度器并且每个coroutine得有一个堆栈空间.
调度器用来在多个对等的coroutine之间做切换操作,每个coroutine的堆栈用于存储各自的上下文内容.

执行单元的入口与出口:

在一个典型的subroutine实现里,执行单元的入口和出口只能有一个, 这是共享调用栈带来的局限性, 比如(x86-64平台)我们在a-subroutine里调用 b-subroutine,那么会先把前6个参数依次写入寄存器:rdi,rsi,rdx,rcx,r8,r9,6 个以上的参数从右至左压栈,rsp不断上移指向栈顶,然后把b-subroutine调用之后的那条指令地址压栈,rsp上移,然后rbp压栈,把rsp指向rbp的栈地址,最后把 b-subroutine里的局部变量依次压栈,rsp继续上移.这就是调用时的入口过程, 当执行是b-subroutine时,就得依次出栈,然后退出,执行a-subroutine里的下一条指令,这是出口过程.很明显,这里b-subroutine只有一个入口和一个出口,因为必须要等b-subroutine执行完成后(出栈)才能继续执行a-subroutine.

而一个典型的coroutine实现,执行单元可以有多个入口和出口, 因为栈不共享, 一个通用的实现模式是用堆来表示coroutine的调用栈, 当我们在a-coroutine里创建b-coroutine, 在堆上分配一块空间用于表示b-coroutine的堆栈, 在执行 b-coroutine时,我们可以在任意点把当前的执行信息写回这块在堆上分配的空间,然后把rsp指向a-coroutine的栈顶,rbp指向a-coroutine的栈frame,rip指向 a-coroutine的需要继续执行的指令的地址, 这也就是所谓的用户态的上下文切换,当下一次需要继续执行b-coroutine的时候,保存当前coroutine的上下文, 恢复b-coroutine的上下文就行了.

上面描述的上下文切换是在用户态进行的,unix-like的环境下, glibc库通常都会有一个描述上下文结构的定义ucontext_t在ucontext.h文件里,并有四个函数:getcontext,setcontext,makecontext,swapcontext分别用于在用户态保存上下文,恢复上下文,创建上下文和保存且恢复上下文,使用它们可以实现一个基本的协程系统, 比如libtask就是一个运行在unix平台上的基础协程库, 能在用户态实现多个执行流轮换执行,libtask对glibc的 getcontext,setcontext,makecontext,swapcontext做了简单的封装,因为这四个函数是libtask实现的基础,所以要研究libtask前,先得了解这4个函数的作用与实现机制.

这里有一个关键的数据结构,即user level context:

 typedef struct ucontext
      {
        unsigned long int uc_flags;
        // 另一个执行流的上下文地址,在x86x64平台下也就是rbx寄存器里的内容
        struct ucontext *uc_link;
        //用于此上下文结构的堆栈,存储在堆区
        stack_t uc_stack;
        // mcontext_t结构体用于存储完整的进程状态信息
        mcontext_t uc_mcontext;
        // 需要block的信号掩码
        __sigset_t uc_sigmask;
        // fpu寄存器结构
        struct _libc_fpstate __fpregs_mem;
    } ucontext_t;

ucontext结构体里的uc_stack是在堆上分配的,并做为堆栈用于此上下文, makecontext函数将会设置uc_stack与相应寄存器里的值uc_stack的结构大致是这样的:

    ---------------------------------------
    | 下一个上下文的地址                   |
    ---------------------------------------
    | 参数 7-n(假如回调函数的参数大于7个)   |
    ---------------------------------------
    |  返回地址                            | %rsp ->  ---------------------------------------

另外寄存器里的内容:

 %rdi,%rsi,%rdx,%rcx,%r8,%r9: 分别存储参数1-6

 %rbx   : 下一个上下文的地址

 %rsp   : 指向栈顶

当我

最低0.47元/天解锁文章

weixin_abctee123

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
关于linux下协程的通用实现及libtask库源码解析

当我们需要创建一个用户态上下文的时候, 需要调用makecontext函数,此函数接受一个ucontext_t类型的指针(ucp), 一个函数指针(切换到此上下文寄存器esp 所指向的地址, 多个函数参数的指针地址(都是int类型,所以在64位环境下需要用两个参数描述一个待执行函数参数的指针地址))从swapcontext的实现可以看出swapcontext所做的事很简单,保存,恢复.把当前上下文按顺序保存到rdi的偏移,新的上下文(rsi指向的地址)覆盖老的上下文.
复制链接

扫一扫