阻塞和非阻塞的实现

​我们可能都已经听过阻塞非阻塞的概念,本文以tcp中的connect系统调用为例子(基于1.12.13内核,新版的原理类似,但是过程就很复杂了,有时间再分析),分析阻塞和非阻塞是什么并且看他是如何实现的。话不多说,直接开始。

static int inet_connect(struct socket *sock, struct sockaddr * uaddr,
      int addr_len, int flags)
{
  struct sock *sk=(struct sock *)sock->data;
  // 调用底层的连接函数,发一个syn包
  err = sk->prot->connect(sk, (struct sockaddr_in *)uaddr, addr_len);
  if (err < 0) 
    return(err);// 还没建立连接成功并且是非阻塞的方式,直接返回
  if (sk->state != TCP_ESTABLISHED &&(flags & O_NONBLOCK)) 
      return(-EINPROGRESS);
  // 早期通过关中断防止竞态情况
  cli(); 
  // 连接建立中,阻塞当前进程
  while(sk->state == TCP_SYN_SENT || sk->state == TCP_SYN_RECV) 
  {
    // 阻塞进程
    interruptible_sleep_on(sk->sleep);
    // 连接失败
    if(sk->err && sk->protocol == IPPROTO_TCP)
    {
      sti();
      sock->state = SS_UNCONNECTED;
      err = -sk->err;
      sk->err=0;
      return err; /* set by tcp_err() */
    }
  }
  sti();
  // 连接建立
  sock->state = SS_CONNECTED;
  // 返回成功
  return(0);
}


我们看到connect函数首先会调用tcp层的函数发送一个sync包,然后根据socket的属性(阻塞非阻塞,可以通过setsocketopt设置)做下一步处理,如果是非阻塞,那么就比较简单,直接返回给应用层。这也是非阻塞+事件驱动架构中的做法。因为这种架构下通常是单进程的,要避免阻塞进程,那么返回后什么时候才能知道连接成功呢?这就是epoll提供的机制,当连接成功后,tcp层会通知epoll,epoll就会通知应用层。下面我们继续分析阻塞的过程,interruptible_sleep_on(sk->sleep)。我们看到socket中有一个sleep字段,该字段用于管理队列。我们看看interruptible_sleep_on

void interruptible_sleep_on(struct wait_queue **p)
{
  __sleep_on(p,TASK_INTERRUPTIBLE);
}static inline void __sleep_on(struct wait_queue **p, int state)
{
  unsigned long flags;
  struct wait_queue wait = { current, NULL };
  current->state = state;
  add_wait_queue(p, &wait);
  save_flags(flags);
  sti();
  schedule();
  remove_wait_queue(p, &wait);
  restore_flags(flags);
}

这里我们只关注两个地方add_wait_queue和schedule。add_wait_queue就是把一个节点插入队列。我们看看wait_queue的定义。

struct wait_queue {
    struct task_struct * task;
    struct wait_queue * next;
};

所以add_wait_queue执行完之后架构如下。

接着调用schedule调度其他进程执行,我们发现这时候当前进程的状态是TASK_INTERRUPTIBLE,所以是不会被调度执行的。这就是进程阻塞的原理,主要是两个过程

1 加入等待队列

2 让出CPU,调度其他进程执行。

我们这个进程什么时候被唤醒呢?我们从收到sync的回包开始分析。具体逻辑在tcp_rcv中。

  if(sk->state==TCP_SYN_SENT)
    {
      /* Crossed SYN or previous junk segment */
      // 发送了syn包,收到ack包说明可能是建立连接的ack包
      if(th->ack)
     {
        // 发送第三次握手的ack包,进入连接建立状态
        tcp_send_ack(sk->sent_seq,sk->acked_seq,sk,th,sk->daddr);
        tcp_set_state(sk, TCP_ESTABLISHED);
        // 唤醒阻塞在connect函数的进程
        if(!sk->dead)
        {
          // 唤醒进程
          sk->state_change(sk);
          // 给进程发送SIGIO信号
          sock_wake_async(sk->socket, 0);
        }
      }
    }

我们看到收到ack后,tcp层调用state_change回调,state_change的值是def_callback1。

static void def_callback1(struct sock *sk)
{
  if(!sk->dead)
    wake_up_interruptible(sk->sleep);
}
我们看到这里会调用wake_up_interruptible唤醒进程。我们看看实现。

void wake_up_interruptible(struct wait_queue **q)
{
  struct wait_queue *tmp;
  struct task_struct * p;if (!q || !(tmp = *q))
    return;
  do {
    if ((p = tmp->task) != NULL) {
      if (p->state == TASK_INTERRUPTIBLE) {
        p->state = TASK_RUNNING;
        if (p->counter > current->counter + 3)
          need_resched = 1;
      }
    }
    tmp = tmp->next;
  } while (tmp != *q);
}

我们看到wake_up_interruptible会唤醒所有进程,这就是导致景群效应的地方,新版内核已经处理了相关问题。另外我们看到,这里这是修改进程为可执行状态,但是不会立刻调度,要等下一次进程调度的时候才发生进程调度。以上就是进程阻塞和非阻塞的原理。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值