总结运行CVPR源码经验教训(一)

前不久,老师给了我一篇论文,让我精读并跑通它的代码,结果已经过了大概十来天了,都还没跑出来(0基础),但每天都有改进,虽不知前方是什么,但每天都有一定的进度与收获,现在就来记录一下这一路的经历。

首先,老师给了我有GPU的服务器,让我在服务器上跑,一开始,我就只知道通过SSH连接服务器,其他一概不知,用pycharm打开项目后,继而选择了解释器上,按照requirements.txt安装了相应的包,但有的安装失败,只能通过克隆github源码安装,例如crowdposetools,将一系列包安装好后,又按要求下载了数据集,大概一共有30G,大概花了3天,然后就在我的windows系统上开始运行项目了,但是报了很多错(源码本应该在linux上运行),比如找不到cfg参数,可我根本不知道这个参数是什么,该怎么设置,于是问了唐宇迪老师,老师给了我一个视频,我看了后大概明白是什么意思了,于是又开始一点一点鼓捣,慢慢的参数配进去了(至少没报无参数或者参数错误的信息了),一运行,又报了路径错误,比如找不到某某文件,或者某某文件不存在(说到这,我又想起了我解决关于项目找不到自己写的模块而导包失败的坎坷经历),于是我又修改yaml文件,将相对路径改成了绝对路径,此时终于路径不报错了,我又运行,结果又说我_C.DIST_BACKEND = 'nccl'不对,一百度,说这是windows系统的问题(其实我在这期间,我已经在尝试使用专业版的pycharm远程连接服务器,老师那边是linux系统,但是也是遇到了很多bug,而且对操作一窍不通,我还尝试通过SSH在服务器上重新创建一个新环境,但是由于权限问题,我根本无法创建,于是这个途径我又暂时搁置了),说回来,当我看到这是windows系统导致的问题时,我开始怀疑,这个代码最终究竟是否能够在windows系统上跑通,做的这些事情会不会白做。晚上,我就问了老师,老师告诉我,windows最终是跑不通的。第二天,我就果断不用本机跑了,一直研究远程服务器,但是我根本没有权限创建新的环境。于是,我改变策略,那就试试这台服务器本有的环境,我找到envs下的一个Datafree环境,一看,里面配了pytorch,也有GPU,于是我就通过Pycharm上的SSH连接到Datafree的解释器上,果不其然里面还是缺少了相应的包,于是我又通过XShell的终端命令去安装相应的包,有的成功,有的失败(例如crowdposetools)。于是我首选克隆github源码,但是终端给我返回的是“认证失败”等一系列错误,百度之后,我总结出,这大概依旧是权限问题。于是,我又改变策略,我将我之前在本机安装好的包,拷到pycharm的对应文件夹下,于是这个问题又解决了,没有再报告说导包失败的一系列错误了。但是要说一个小细节,因为根据前面的教训,这一次我首先只放了一个比较小的数据集在里面,大概几百M,所以大概花了2h左右传到了服务器上,于是我又开始运行,我发现它又报了一些包的版本问题,大概是因为我用的别人的环境,但是这个错误还比较好解决,直接通过终端重新安装即可,例如pip install -U protobuf,

于是解决了!

再次运行,结果又说找不到标注文件后来一查原因,是路径问题,于是我又到yaml文件,将路径修改成绝对路径了(对应服务器的绝对路径),该问题和在windows上的解决方案一致,

再次运行,结果又说找不到‘lib’文件(该,lib文件是项目里的)我猜肯定又是路径问题,于是找到对应位置,将其改为了服务器的绝对路径

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值