一直好奇 php 源码的文件/代码形式,也想知道 curl 实现并发请求的 内部原理。
所以想查看一下 curl*multi* 的实现源码:
1. php 实现并发的主要函数是 curl_multi_exec 。
2. 选取 php-5.6.13 版,查找 curl 包 curl_multi_exec 函数 在php 源码的路径 \ext\curl\multi.c L198: PHP_FUNCTION(curl_multi_exec)
3. 发现php源码只是调用 libcurl 包的 curl_multi_perform 来实现并发。函数说明: http://dlang.org/library/etc/c/curl/curl_multi_perform.html
4. 选取 curl-7.44.0 查看 libcurl 包的c源码,路径 \lib\multi.c L1782: CURLMcode curl_multi_perform(CURLM *multi_handle, int *running_handles)
5. 发现 curl_multi_perform 是 通过 循环中调用 multi_runsingle(multi, now, data); 来轮询多个并发的连接。
data=multi->easyp;
while(data) {
result = multi_runsingle(multi, now, data);
data = data->next; /* operate on next handle */
}
6. 定位 multi_runsingle 函数在 \ext\curl\multi.c L975 ,负责处理单个请求,代码形式如下:
do {
// 处理管道崩溃或队列处理
// 判断并处理请求超时
// 通过轮询状态的方式完成请求各种状态的处理
switch (data->mstate) {
case CURLM_STATE_** {
<span style="white-space:pre"> </span>...
<span style="white-space:pre"> </span>break; // 每个状态处理完都break出来,以进入下一个循环
}
}
} while((rc == CURLM_CALL_MULTI_PERFORM) || multi_ischanged(multi, FALSE));
7. 由此看到,libcurl 并没有用 event 相关包来实现请求过程的非阻塞,只是在单独处理每个请求时,针对不同状态做了非阻塞的设置。