http://fool.is-programmer.com/2011/3/26/libcurl-signal-bug.25603.html
今天运气不错,解决了两个非常棘手的Bug,这一个是关于libcurl的。
我的程序在一个线程中执行主循环,需要从网络下载东西时,就开启另一个线程,执行curl_easy_perform。问题是,程序在执行一段时间后会自己崩溃掉,backtrack如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
|
#0 0x4001e416 in __kernel_vsyscall ()
#1 0x40491941 in raise (sig=6) at ../nptl/sysdeps/unix/sysv/linux/raise.c:64
#2 0x40494e42 in abort () at abort.c:92
#3 0x404c9305 in __libc_message (do_abort=2,
fmt=0x4059f36a "*** %s ***: %s terminated\n")
at ../sysdeps/unix/sysv/linux/libc_fatal.c:189
#4 0x4054c970 in __fortify_fail (msg=<value optimized out>)
at fortify_fail.c:32
#5 0x4054c8da in ____longjmp_chk ()
at ../sysdeps/unix/sysv/linux/i386/____longjmp_chk.S:76
#6 0x4054c849 in __longjmp_chk (env=<value optimized out>, val=1)
at ../setjmp/longjmp.c:40
#7 0x4020dd08 in alarmfunc () from /usr/lib/libcurl-gnutls.so.4
#8 <signal handler called>
#9 0x4001e416 in __kernel_vsyscall ()
#10 0x4004b930 in sem_wait@GLIBC_2.0 ()
at ../nptl/sysdeps/unix/sysv/linux/i386/i686/../i486/sem_wait.S:318
#11 0x400fa7ac in PeekMessageEx (pMsg=0xbffff0b8, hWnd=134580240,
iMsgFilterMin=0, iMsgFilterMax=0, bWait=1, uRemoveMsg=1) at message.c:628
#12 0x0804b45f in GetMessage (this=0xbffff104)
at /usr/local/include/minigui/window.h:1935
#13 WeiboUI::Application::run (this=0xbffff104) at application.cc:99
#14 0x08049df0 in MiniGUIAppMain (argc=1, argv=0xbffff274) at main.cc:56
#15 0x08049f4c in main (args=1, argv=0xbffff274) at main.cc:56
|
简单说明一下,就是主循环在执行sem_wait時,被一个信号打断,然后导致整个程序的崩溃。问题的关键就在那个alarmfunc (),是libcurl打断了我的循环。
最后以alarmfunc为关键词搜索后才发现,原来libcurl居然使用alarm来实现超时的判断!在多线程环境里,alarm产生的信号会打断一切主循环,然后导致非常难以察觉的Bug。
解决方法很简单,把CURLOPT_NOSIGNAL设为1就行了,这样libcurl将不会产生任何信号:
http://curl.haxx.se/libcurl/c/curl_easy_setopt.html#CURLOPTNOSIGNAL