PyTorch环境搭建中的错误排查
镜像下载
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple xxx
xxx为需要下载的包名 使用镜像可以加快下载速度
有时虽然在Anaconda中配置了镜像下载资源 但是下载还是很慢 尤其是校园网环境 经常因为网络速度太慢导致链接超时
可以在命令行中使用镜像下载 实测速度很快
这里以清华的镜像为例 还可以使用阿里云、豆瓣、华中科技等镜像下载
ImportError: DLL load failed while importing _imaging: 找不到指定的模块
包明明都已经装了 也确实在环境中可以看到 却报错找不到指定模块
针对以上情形 在错误排查后 发现是由于Pillow版本过高不适配引起的( ‘PIL’ 版本或与 ‘PIL’ 相关的包与当前python版本不兼容)
python版本:3.9.16
pillow版本:9.4.0
卸载原来的Pillow 重新下载Pillow8.4.0版本后 问题解决
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple Pillow==8.4.0
官方给出的文档说明中Python3.9是可以使用Pillow9.3及以上版本的 但是实际运行还是会报错
可能自己环境搭配有问题 在换装低版本后问题解决
环境问题千奇百怪 如果当前稳定运行 还是不要随意选择升级包的版本 很痛苦 真的很痛苦 手贱运行了update all 结果就是跑什么都在报错模块找不到
关于tensorboard显示不出数据的问题
运行命令如上
可以看到确实存在数据文件 但是调用显示失败
这里可以使用全路径名称 即logs的全路径
或者是加上包名用以区分不同的文件(如果根目录下有多个工作目录)
成功解决问题 (要注意自己文件的目录结构 根目录为工作目录的话 会少很多问题 在根目录下创建多个工作目录来运行不同的代码时 需要注意自己的目录结构)
关于tensorboard中使用writer.add_image()方法 step设置了自增 但是最终显示不连续、中间缺少很多步的问题(比如step初始值为0,循环200次,应该有200步,但是最后显示结果只有10步,且开始的值并不为0)
如下图,开始step为3,且只显示10个
如果发现 step
不连续,有缺失,很正常,默认只显示十步。
如果想要显示更多图片,输入以下命令:
tensorboard --logdir=p10 --samples_per_plugin=images=100
这样子可以显示100步,根据自己的需要设置大小,step就会连续了