文章目录
前言
MindSpore AI框架适配WideDeep模型训练问题处理
1.测试环境
ubuntu18.04 aarch64 mindspore r1.5 python3.7.5 scikit_learn 1.0.1 glibc2.17
2.问题现象

3.错误分析
经过网络查询,这是libgomp在arm平台上的一个bug。libgomp gets the statically allocated TLS space that it needs, before the optimization of handing out that space to other libraries kicks in .
即:libgomp-d22c30c5.so.1.0.0运行时占用了TLS部分内存.
4.解决方案
方法一:
如参考文献2,glibc版本2.17不变,显示声明环境变量LD_PRELOAD如下:
export LD_PRELOAD=$LD_PRELOAD:/usr/local/python3.7.5/lib/python3.7/site-packages/scikit_learn.libs/libgomp-d22c30c5.so.1.0.0
- 1
方法二:
如参考文献1,升级glibc版本到2.32.
5.参考文献
[1] Bug 1722181 - libgomp.so.1: cannot allocate memory in static TLS block, https://bugzilla.redhat.com/show_bug.cgi?id=1722181
[2] Autokeras trying to import libgomp-d22c30c5.so.1.0.0 from scikit-learn on arm64/aarch64 #1475, https://github.com/keras-team/autokeras/issues/1475
本文探讨了在Ubuntu 18.04 arm64环境下,使用MindSpore 1.5训练WideDeep模型时遇到的libgomp静态TLS内存占用问题。通过分析,确定为libgomp库bug,并提供了两种解决方案:一是通过环境变量LD_PRELOAD临时加载特定版本的libgomp,二是升级glibc至2.32版本。
1102

被折叠的 条评论
为什么被折叠?



