现象:线程2中的资源初始化依赖于线程1中的资源,在执行效率更高的x86上,模块的执行没有问题,在性能低的单片机上,模块的执行出现了问题
原来业务代码有两个线程,线程1和线程2,线程2中的操作逻辑用到了线程1中初始化的资源,线程1中的资源包括初始化的网卡信息,以及用于通讯的UdpSocket。
原有代码中线程2中使用UdpSocket进行通讯时,并没有等待线程1中的资源初始化完成就进行操作了,原有代码之所以没有发生崩溃,是因为线程2中的UdpSocket大概率不会在线程1没有初始化完成之前进行通讯,所以在线程2使用UdpSocket时,UdpSocket大概率已经完成初始化操作了,且由于使用的是基于POSIX的socket,其出错并不会导致进程崩溃。
但是,我更换了Zmq库,其在Socket传错参数时会回馈Invalid Augment,并且直接抛出错误,导致进程崩溃,我在线程2启动初始化Socket时用到了线程1中初始化的网卡信息,参考先人的代码,我也没加锁。。。。并且在x86上运行一点问题没有,有时候使用gdb在单片机上进行debug时,也不会出错。。。。debug发现线程2进行socket构建时,线程1中的网卡信息获取并没有执行完成,网卡的ip压根就没获取到,导致初始化时的参数就存在问题,加了个用于等待的自旋锁立马就好使了。
想起了当时看csapp上说过的一句话,“多线程时不要假设任何指令的执行顺序”,面对共享资源时一定要考虑临界区的读写问题
不知名电子厂重构屎山的第151天