自己编译源码安装tensorflow
文章目录
前言
为什么要自己编译源码呢?自己编译tensorflow,为自己的机器定制一个tensorflow版本,不需要的模块可以不编译,算是为自己裁剪奠定一点基础。还有一个好处是,可以直接拉取最新的开源代码,这往往要比别人快几个月体验新特性。然而自己编译源码会遇到很多错误,而且每个人因为环境不一样,报的错误也不一样。一般都是缺少包,或者包的名字有差异,版本不对,一个个根据错误信息去解决。Come ON!
1 准备工作
1.1 下载源码
因为国内github过于慢,可以在gitee上下载。
1.2 安装bazel
网上有很多方式,不去外网的前提下唯一成功的方式是下面的办法。
npm install -g @bazel/bazelisk
2 编译tensorflow
2.1 配置选项
在tensorflow的源码根目录下运行configure
,根据对话选择要支持的特性。
./configure
补充说明运行configure
时出现的几个名词:
RoCm–AMD GPU生态
TensorRT–加速神经网络实时计算,这个特性的支持一般要落后一个大版本,也就是说英伟达支持TensorRT8的时候,tensorflow才支持TensorRT7。也就是最新出的GPU,tensorflow往往支持的不好。
2.2 编译CPU版本的tensorflow
使用bazel编译cpu版本的tensorflow,指定--jobs
的目的是防止bazel编译时吃掉全部内存而导致编译失败。如下命令中参考数字--jobs=16
,机器实际物理内存为32G。
bazel build //tensorflow/tools/pip_package:build_pip_package --jobs=16
2.3 编译GPU版本的tensorflow
在编译GPU版本时,提示找不到python,解决的办法是创建一个名为python的软链接指向python3。
ln -s /usr/bin/python /usr/bin/python3
bazel build --config=cuda //tensorflow/tools/pip_package:build_pip_package --jobs=16
3 构建pip安装包
多一句嘴,tmp目录实际上是内存虚拟文件。
./bazel-bin/tensorflow/tools/pip_package/build_pip_package /tmp/tensorflow_pkg
4 安装pip包
敲了目录/tmp/tensorflow_pkg/,后面可用tab自动补齐tensorflow的版本信息。如下图,成功安装了tensorflow的最新发布版本,此时该版本还没有进入到pip install
。自己安装的源码,不要在tensorflow源码中启动python,到后导入tensorflow,这是从设计角度所禁止的行为。
pip install /tmp/tensorflow_pkg/tensorflow-version-tags.whl