2s-AGCN【复现】EOFError: Ran out of input 问题解决记录(win10+pycharm)

win10上用pycharm复现2s-AGCN论文程序,在环境和文件路径都调通之后
在终端里输入 python main.py --config ./config/nturgbd-cross-view/train_joint.yaml
出现了下面的这样一个报错

[ Tue Apr 12 18:18:56 2022 ] Parameters:
{'work_dir': './work_dir/ntu/xview/agcn_joint', 'model_saved_name': './runs/ntu_cv_agcn_joint', 'config': './config/nturgbd-cross-view/train_joint.yaml', 'phase': 'train', 'sa
ve_score': False, 'seed': 1, 'log_interval': 100, 'save_interval': 2, 'eval_interval': 5, 'print_log': True, 'show_topk': [1, 5], 'feeder': 'feeders.feeder.Feeder', 'num_worke
r': 32, 'train_feeder_args': {'data_path': './data/ntu/xview/train_data_joint.npy', 'label_path': './data/ntu/xview/train_label.pkl', 'debug': False, 'random_choose': False, '
random_shift': False, 'random_move': False, 'window_size': -1, 'normalization': False}, 'test_feeder_args': {'data_path': './data/ntu/xview/val_data_joint.npy', 'label_path':
'./data/ntu/xview/val_label.pkl'}, 'model': 'model.agcn.Model', 'model_args': {'num_class': 60, 'num_point': 25, 'num_person': 2, 'graph': 'graph.ntu_rgb_d.Graph', 'graph_args
': {'labeling_mode': 'spatial'}}, 'weights': None, 'ignore_weights': [], 'base_lr': 0.1, 'step': [30, 40], 'device': [0], 'optimizer': 'SGD', 'nesterov': True, 'batch_size': 1
6, 'test_batch_size': 16, 'start_epoch': 0, 'num_epoch': 50, 'weight_decay': 0.0001, 'only_train_part': False, 'only_train_epoch': 0, 'warm_up_epoch': 0}

[ Tue Apr 12 18:18:56 2022 ] Training epoch: 1
  0%|                                                                                                                                                | 0/1204 [00:09<?, ?it/s]
Traceback (most recent call last):
  File "main.py", line 578, in <module>
    processor.start()
  File "main.py", line 519, in start
    self.train(epoch, save_model=save_model)
  File "main.py", line 379, in train
    for batch_idx, (data, label, index) in enumerate(process):
  File "D:\anaconda3\envs\wq\lib\site-packages\tqdm\std.py", line 1195, in __iter__
    for obj in iterable:
  File "D:\anaconda3\envs\wq\lib\site-packages\torch\utils\data\dataloader.py", line 291, in __iter__
    return _MultiProcessingDataLoaderIter(self)
  File "D:\anaconda3\envs\wq\lib\site-packages\torch\utils\data\dataloader.py", line 737, in __init__
    w.start()
  File "D:\anaconda3\envs\wq\lib\multiprocessing\process.py", line 105, in start
    self._popen = self._Popen(self)
  File "D:\anaconda3\envs\wq\lib\multiprocessing\context.py", line 223, in _Popen
    return _default_context.get_context().Process._Popen(process_obj)
  File "D:\anaconda3\envs\wq\lib\multiprocessing\context.py", line 322, in _Popen
    return Popen(process_obj)
  File "D:\anaconda3\envs\wq\lib\multiprocessing\popen_spawn_win32.py", line 65, in __init__
    reduction.dump(process_obj, to_child)
  File "D:\anaconda3\envs\wq\lib\multiprocessing\reduction.py", line 60, in dump
    ForkingPickler(file, protocol).dump(obj)
OSError: [Errno 22] Invalid argument
Traceback (most recent call last):
  File "<string>", line 1, in <module>
  File "D:\anaconda3\envs\wq\lib\multiprocessing\spawn.py", line 105, in spawn_main
    exitcode = _main(fd)
  File "D:\anaconda3\envs\wq\lib\multiprocessing\spawn.py", line 115, in _main
    self = reduction.pickle.load(from_parent)
EOFError: Ran out of input

我的第一反应是线程的问题,但是发现在训练文件work_dir/ntu/xview/agcn_bone/config.yaml下,怎么改num_worker都不行,只要程序一运行,又变成了默认的32,如下图所示
在这里插入图片描述
后来发现,这个config.yaml文件是代码生成文件,要是修改的话,需要到main.py函数文件下的def get_parser():里面去修改
在这里插入图片描述default=32改成defalt=0或1程序就能跑通啦

num_worker=0表示只有主进程去加载batch数据,这个可能会是一个瓶颈。
num_worker=1表示只有一个worker进程用来加载batch数据,而主进程是不参与数据加载的。这样速度也会很慢。
num_workers>0 表示只有指定数量的worker进程去加载数据,主进程不参与。增加num_worker也同时会增加CPU内存的消耗。所以num_worker的值依赖于 batch size和机器性能。
一般开始是将num_worker设置为等于计算机上的CPU数量
最好的办法是缓慢增加num_worker,直到训练速度不再提高,就停止增加num_worker的值。
上面关于num_worker的说明转自下面大佬的文章,这里大家点过去看可能不方便,我就重新改在这里啦
https://www.jianshu.com/p/16860e392844

  • 2
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 6
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值