1. PPOCR训练时程序崩溃,定位是到forward过程中,报错信息如下:
--------------------------------------
C++ Traceback (most recent call last):
--------------------------------------
0 paddle::framework::SignalHandle(char const*, int)
1 paddle::platform::GetCurrentTraceBackString[abi:cxx11]()
----------------------
Error Message Summary:
----------------------
FatalError: `Segmentation fault` is detected by the operating system.
[TimeInfo: *** Aborted at 1637136969 (unix time) try "date -d @1637136969" if you are using GNU date ***]
[SignalInfo: *** SIGSEGV (@0x0) received by PID 17540 (TID 0x7f7a28056740) from PID 0 ***]
Segmentation fault (core dumped)
可能原因:安装的paddlepaddle版本与系统里的cuda版本不匹配,修改配置文件中的use_gpu为fasle,如果可以正常训练,那么就是这个问题,如果不能,继续定位。
比如我的系统里安装的是cuda10.2, 通过pip install 安装的paddlepaddle的包没有匹配的版本,所以更新cuda版本后,安装相应的paddlepaddle解决了问题。
参考: