接上一篇博客 win10下用Deeplabv3+训练VOC数据集(一)
运行train.py碰到的问题,及解决办法
小白第一次跑这个算法,不会ubuntu,只能在win10(有GPU)下跑跑,但是在pycharm里边有的参数又不知道改啥或者怎么改,参考这个博主的训练过程,在models-master\research\deepla
b目录底下建立批处理文件X-Train.bat
,双击打开
由于我的环境是在 anaconda3中新建的tf1.15.0,python3.6.10的虚拟环境,所以不能根据那个博主的模板写,最主要的前面这几行代码
echo "Start training..."
cd C:\Users\Star Ma\Anaconda3\envs\tf15_py36 #进入当前所需的环境下
call activate tf15_py36 #激活虚拟环境,不加call会闪退
cd D:\StarMa\models-master\research\deeplab #进入当前deeplab文件下
python train.py ^
--logtostderr ^
--training_number_of_steps=1000 ^ #先训练1000步
--train_split="train" ^ #选择用于训练的数据集
--model_variant="xception_65" ^
--atrous_rates=6 ^
--atrous_rates=12 ^
--atrous_rates=18 ^
--output_stride=16 ^
--decoder_output_stride=4 ^
--train_crop_size=321,321 ^ #机器内存不够,适当调小
--train_batch_size=1 ^ #因为机器内存不够,设置为1
--fine_tune_batch_norm=False ^ #因为train_batch_size=1,设置为false
--dataset="pascal_voc_seg" ^
--tf_initial_checkpoint=.\datasets\init_models\deeplabv3_pascal_train_aug\model.ckpt ^ #下载的权重
--train_logdir=./checkpoint ^ # 保存训练的中间结果的路径
--dataset_dir=./datasets/tfrecord # 生成的tfrecord的路径
PAUSE
还有一点需要注意,如果train之前的步骤都没问题,好多博主都是train_crop_size
都是按照下面方式写的,我这样写然后运行会出错
--train_crop_size=321
--train_crop_size=321
#改为
改为
--train_crop_size=321,321
就可以了,暂时还不知道原因