快乐是要保鲜的,bug是要被冻死的。
可视化网络结构工具参考
pdb调试
常用镜像
Pycharm可以run但不能debug
检查文件命名。比如命名了一个stat.py,和python库里的文件有重名,debug就会报错”Connection to Python debugger failed socket closed“。
urllib.error.URLError: urlopen error [SSL: CERTIFICATE_VERIFY_FAILED]
取消证书验证
import ssl
ssl._create_default_https_context = ssl._create_unverified_context
tensorboard ValueError: Duplicate plugins for name projector
在site-packages文件夹下, 删掉tensorboard–2.0.0dist-info
self.modules() 和 self.children()
参考
也就是说self.children()遍历的是子网络 self.modules()采用的是dfs遍历,遍历了 net itself, net’s children, children of net’s children。
matlab后台运行产生的Bad file descriptor 和 Warning: “Error reading character from command line”
nohup matlab -nodesktop -nosplash -nodisplay -r main >log.txt 2>&1 &
改为
nohup matlab -nodesktop -nosplash -nodisplay < main.m >log.txt 2>&1 &
SummaryWriter has no attribute …
tensorboard的SummaryWriter之类没有什么什么属性很有可能就是版本不对。出现一些奇怪的错就考虑一下版本适配。用的torch版本1.1.0以下考虑换tensorboardX(1.1.0有时用tensorboard不行换tensorboardX就好了)
移植conda环境
没安装的话先pip/conda装conda-pack
conda-pack -n env_name -o output.tar.gz。 如果报错”This is usually due to pip
uninstalling or clobbering conda managed files“ 就用 conda-pack -n env_name -o output.tar.gz --ignore-missing-files
然后拷到机子上 tar -zxvf output.tar.gz 就行了
OSError: /home/wang/.local/lib/python3.8/site-packages/torch/lib/…/…/nvidia/cublas/lib/libcublas.so.11: undefined symbol: cublasLtGetStatusString, version libcublasLt.so.11
参考
先看nvidia-cublas的路径
pip list |grep nvidia
nvidia-cublas-cu11 11.10.3.66
nvidia-cuda-nvrtc-cu11 11.7.99
nvidia-cuda-runtime-cu11 11.7.99
nvidia-cudnn-cu11 8.5.0.96
然后
export LD_LIBRARY_PATH=/xxx/lib/python3.8/site-packages/nvidia/cublas/lib/:$LD_LIBRARY_PATH
WARNING: There was an error checking the latest version of pip
更新版本
python -m pip install --upgrade pip
pip install --upgrade pip
TypeError: meshgrid() got an unexpected keyword argument ‘indexing‘
去掉indexing这个参数就好了
tar的解压命令
参考
主要常用的就是解压到指定目录
> tar -xzvf rumenz.tar.gz -C one/
libgcc_s.so.1 must be installed for pthread_cancel to work
import ctypes
libgcc_s = ctypes.CDLL('libgcc_s.so.1')