对 zebra 的一点理解 thread+socket+read部分 (备忘)

最新推荐文章于 2021-04-30 16:15:56 发布

atefrice

最新推荐文章于 2021-04-30 16:15:56 发布

阅读量5.4k

点赞数 5

分类专栏： Linux 网络编程文章标签： zebra thread socket

本文链接：https://blog.csdn.net/atefrice/article/details/47730605

版权

本文深入剖析Zebra中的线程管理机制，包括thread、socket和read事件处理。每个守护进程都有一个thread_master，包含read、write、timer等链表。线程按照event、timer、ready顺序执行，read、write事件通过thread_add_read/write加入。thread_fetch查找并执行线程，处理read、write和timer。文章还介绍了线程如何添加、删除和调度，以及与vtysh的通信和socket的阻塞处理。

摘要由CSDN通过智能技术生成

一、主要从 daemon 的 thread角度分析备忘。

注意：具体函数功能详见附录，分析要结合zebra源代码(thread.c中)。

1、每个daemon(e.g igmp-snooping、ring)都定义一个 master 的全局变量；

2、master 内有六个 struct thread_list *read、write 等六个链表；

3、最小的执行单元为 thread ，必要的时候会挂在对应的 thread_list 上；

4、最终最重要的是各个daemon的 main函数最后的 while(thread_fetch(master, &thread)) thread_call(&thrad);

5、thread_fetch 功能是查找master 结构下的几个 struct thread_list 链；

6、其中，三个链是比较重要的，struct thread_list *event、timer、ready；

7、thread_fetch 的查找顺序也是上边这个顺序，所以其没有真正的优先级抢断问题(真正的线程pthread)；

8、查找每个链的过程就是看看该链上有没有准备好的 thread；

9、有的话从该链上移除，做适当的 type 等重新赋值，然后加入到 unuse 链上；《thread_run() 的执行过程》

注：移到 unuse 链上，而不是直接free掉，是为了以后有新的thread要挂到 event、timer、ready等链上的时候，可以直接来 unuse 链上来取，不用重新 malloc，节省时间。

10、然后返回查找到的 thread，然后main中的while下调用thread_call(&thrad) 执行该块 thread；

11、此外还有两个重要的明示给用户(程序员)的 thread_list * read、write，对应 socket 的 read、write事件；

12、当有 read、write类型的socket 要加入到list 时，调用 thread_add_read/write 把相应的 sfd及 func以thread的形式加入到对应的 read 或者 write thread_list；

13、同时，重要的是： thread_add_read 里只要是把对应的 sfd 加入到 master->readfd/writefd(fd_set 类型);

14、而后 thread_fetch里调用 select 对 read、write、error 的fd_set进行监听；

15、并调用两次thread_process_fd把有事件的fd(FD_ISSET) 对应的 thread 从 thread_list * read、write 链中移除；

16、并进一步加入到ready链中；

17、在thread_fetch 最后，再对ready链中移除头元素，加入unuse 链，返回该thread块，并等待thread_call执行；

18、对于 thread_fetch中timer链的查找，遍历timer链中所有thread，查找超时的 thread，返回该thread：过程如下：

19、当用 thread_add_timer 添加 timer 事件时，用参数func、time、master等，构造一个 thread；

20、其中thread->u.sands 为 (gettimeofday + time), 是未来的某一个时间值，遍历timer链上的thread时，再 gettimeofday一下，然后与 thread->u.sands对比，确定该thread 是否超时可执行；

21、对于thread_fetch中监听 read、write事件的 select 的timeout 时间问题：函数 thread_time_wait()

22、(NO sort)遍历 timer链上所有thread，取最小的 thread->u.sands ，与现在的gettimeofday比较，若小于(表明最小的thread块已经超时)则timeout,应该给一个最小的值，免得timer事件误差太大，timeout=10us；

若大于gettimeofday(sec>=0)(还未超时)，则 timeout=该值与gettimeofday之差；再while1的时候下一个 thread正好超时一点，不会误差太大；

若 timer链上无thread，则select 为阻塞。(timeout=NULL); (没有事件处理阻塞，进程挂起无影响)

二、daemon与vtysh间的通信(依赖daemon的thread机制)

注：①其间的通信主要是 vtysh从终端获取输入的CLI命令，然后解析，根据DEFSH或者其他发往指定daemon；

②vtysh进程会和每个daemon进行connect；

③connect分两种，一种是vtysh进程main中 connect_default(rcs默认启动的daemon)；

二是 vtysh_send之前会 connect 对应的 daemon

下边结合 daemon (e.g igmp-snooping) 与 vtysh 进程通信来举例：

1、 igmp-snooping 的 main 中，如下图所示吧:

2、实际上但从发送CLI命令字符来看，是daemon端维护一个 select， vtysh 端 connect及 send；

3、可待续补充......

三、vtysh端的read、write的阻塞与数据传输不丢失保证

1、待补充.....

四、daemon端接收其他报文的socket

1、igmp-snooping 要申请一个 g_snoop_pkt_sock=socket(AF_INET,SOCK_PACKET,htons(0800));

2、该socket 用来接收 igmp 报文；

3、根据网上的资料，对于socket类型的文件，不显式用fcntl (sockfd,F_SETFL,O_NONBLOCK) 设定时，默认阻塞；

4、所以 recv(g_snoop_pkt_sock，，) 为阻塞的；但该阻塞永远不会发生！！！原因如下：

5、在 igmp-snooping enable中用 thread_add_read 把 g_snoop_pkt_sockadd到read 链里，即，受select监控。

6、只有在有 igmp 报文到达该g_snoop_pkt_sock 时，select检测到，并执行thread块，即igmp_snooping_read，

进而才会执行到阻塞的 recv(g_snoop_pkt_sock，，)，但此时为已经有报文过来，所以该recv不会阻塞；

7、结论：对于该接收其他AF_INET报文的 socket，在该架构下，阻塞与否几乎无差异！！

8、ring 中接收ring报文的几乎和上述相同，g_ring_sock = socket(AF_INET, SOCK_PACKET, htons(0x7010));

9、下边的步骤同上述 2---7，另， ring 的 socket 用的 read。

以下附录两篇关于 zebra 的文章，以防收藏被删：

附录一：原文链接：http://blog.csdn.net/xuyanbo2008/article/details/7439733

==========================================================

一、线程机制概述

zebra这个软件包整体结构大致可分为两大块：协议模块和守护进程模块。协议模块实现各协议的功能，各协议以子模块的形式加载到zebra中；守护进程模块的功能主要是管理各协议的信令传输、表项操作、系统操作调用等事务，为各协议提供底层信息以及相关的硬件处理等功能支持。Zebra与各协议的交互采用的是C-S模式，在每个协议子模块中均有一个Client端与守护进程模块中的Server端交互，它们所使用的socket为zebra内部使用的socket，不与外部交互。

zebra中的线程是分队列调度的，每个队列以一个链表的方式实现。线程队列可以分成五个列：event、timer、ready、read、write。队列的优先级由高到低排列。但是，read和write队列并不参与到优先级的排列中，实际操作时，如果read和write队列中的线程就绪，就加入ready队列中，等待调度。调度时，首先进行event队列中线程的调度，其次是timer和ready。