Pointnet++复现流程及问题解决

最新推荐文章于 2024-04-12 15:58:45 发布

置顶 Silencer_s

最新推荐文章于 2024-04-12 15:58:45 发布

阅读量3k

点赞数 4

分类专栏：点云文章标签： python linux 深度学习 tensorflow

本文链接：https://blog.csdn.net/Silencer_s/article/details/109623253

版权

点云专栏收录该内容

4 篇文章 0 订阅

订阅专栏

复现流程

1.通过github下载pointnet++的包;

2.以分类为例，在pointnet2-master目录下新建data文件夹，将modelnet40_ply_hdf5_2048数据集解压到data文件夹内;

3.安装相关环境配置，有如下建议：
a. Anaconda3还是要装的，conda的虚拟环境在学习阶段，有着多种网络且各个网络环境不同时还是挺好用的
b.通过conda创建python2.7的虚拟环境
c.在python2.7的虚拟环境中安装conda install tensorflow-gpu==1.12.0，conda install会同时帮我们安装cudatoolkit 9.2 和 cudnn 7.6.5，测试此环境可运行pointnet++和spider cnn这两个架构
d.其他缺少的包可通过查找来做相应安装

4.tf_ops目录下的三个文件编译
铺垫：任意打开一终端，通过locate cuda_runtime.h查找cuda_runtime.h位置。
本人电脑的结果如：/usr/local/cuda-10.0/include/cuda_runtime.h
a.对3d_interpolation内容修改
将tf_interpolate_compile.sh文件内的内容修改为：

# Get TF variables
TF_INC=$(python -c 'import tensorflow as tf; print(tf.sysconfig.get_include())')
TF_LIB=$(python -c 'import tensorflow as tf; print(tf.sysconfig.get_lib())')

g++ -std=c++11 tf_interpolate.cpp -o tf_interpolate_so.so -shared -fPIC -I$TF_INC  -I$TF_INC/external/nsync/public  -L$TF_LIB -ltensorflow_framework -O2 -D_GLIBCXX_USE_CXX11_ABI=1

修改完成后运行sh tf_interpolate_compile.sh

b.对grouping内容修改
将tf_grouping_compile.sh文件内的内容修改为：

#/bin/bash
/usr/local/cuda-10.0/bin/nvcc tf_grouping_g.cu -o tf_grouping_g.cu.o -c -O2 -DGOOGLE_CUDA=1 -x cu -Xcompiler -fPIC
#!!!!!!上处cuda-10.0版本跟据locate cuda_runtime.h结果修改为相应的版本！！！！！！

# Get TF variables
TF_INC=$(python -c 'import tensorflow as tf; print(tf.sysconfig.get_include())')
TF_LIB=$(python -c 'import tensorflow as tf; print(tf.sysconfig.get_lib())')

g++ -std=c++11 tf_grouping.cpp tf_grouping_g.cu.o -o tf_grouping_so.so -shared -fPIC -I$TF_INC  -I$TF_INC/external/nsync/public  -L$TF_LIB -ltensorflow_framework -O2 -D_GLIBCXX_USE_CXX11_ABI=1

将tf_grouping.cpp文件，第十行#include <cuda_runtime.h>修改为#include </usr/local/cuda-10.0/include/cuda_runtime.h>，修改内容见铺垫
修改完成后运行sh tf_grouping_compile.sh

c.对sampling内容修改
将tf_sampling_compile.sh文件内的内容修改为：

#/bin/bash
/usr/local/cuda-10.0/bin/nvcc tf_sampling_g.cu -o tf_sampling_g.cu.o -c -O2 -DGOOGLE_CUDA=1 -x cu -Xcompiler -fPIC
#!!!!!!上处cuda-10.0版本跟据locate cuda_runtime.h结果修改为相应的版本！！！！！！

# Get TF variables
TF_INC=$(python -c 'import tensorflow as tf; print(tf.sysconfig.get_include())')
TF_LIB=$(python -c 'import tensorflow as tf; print(tf.sysconfig.get_lib())')

g++ -std=c++11 tf_sampling.cpp tf_sampling_g.cu.o -o tf_sampling_so.so -shared -fPIC -I$TF_INC  -I$TF_INC/external/nsync/public  -L$TF_LIB -ltensorflow_framework -O2 -D_GLIBCXX_USE_CXX11_ABI=1

将tf_sampling.cpp文件，第十行#include <cuda_runtime.h>修改为#include </usr/local/cuda-10.0/include/cuda_runtime.h>，修改内容见铺垫
修改完成后运行sh tf_sampling_compile.sh

5.在pointnet2-master文件第一级目录下打开python2.7的conda虚拟环境，运行python train.py即可训练

报错解决

1.如下报错：

/usr/bin/ld: 找不到 -ltensorflow_framework
collect2: error: ld returned 1 exit status

修改方法：一开始用的tf1.14.0,cuda10.1,cudnn7.6.5,就会报着个错误。论文给的环境是cuda8和cudnn6，经过测试，cuda9和cudnn7还能运行，再高就不行了，所以就别装tf1.12以上的tf架构了。anaconda就是解决这种问题的。

2.如下报错：

fatal error: cuda_runtime.h: No such file or directory

修改方法：通过locate cuda_runtime.h查找cuda_runtime.h位置（本人电脑的结果如：/usr/local/cuda-10.0/include/cuda_runtime.h ），之后将cpp文件里的内容修改#include <cuda_runtime.h>修改为#include </usr/local/cuda-10.0/include/cuda_runtime.h>

3.如下报错：

ZN10tensorflow8internal21CheckOpMessageBuilder9NewStringEv

修改方法：将tf_ops目录下的三个文件的sh文件按上文修改后再进行sh命令。
主要就是要帮sh文件内的命令找对目录，并且要将-D_GLIBCXX_USE_CXX11_ABI=0修改为 -D_GLIBCXX_USE_CXX11_ABI=1

Silencer_s

关注

4
点赞
踩
33

收藏

觉得还不错? 一键收藏
5
评论
Pointnet++复现流程及问题解决

复现流程1.通过github下载pointnet++的包;2.以分类为例，在pointnet2-master目录下新建data文件夹，将modelnet40_ply_hdf5_2048数据集解压到data文件夹内;3.安装相关环境配置，有如下建议：a. Anaconda3还是要装的，conda的虚拟环境在学习阶段，有着多种网络且各个网络环境不同时还是挺好用的b.通过conda创建python2.7的虚拟环境c.在python2.7的虚拟环境中安装conda install tensorflow-
复制链接

扫一扫