在集群服务器进行自定义数据集训练记录过程 TensorBoard logging requires TensorBoard with Python summary writer installed.

先记录解决办法:
TensorBoard logging requires TensorBoard with Python summary writer installed. This should be available in 1.14 or above.
办法:
pip install tensorflow-tensorboard1.5.1
pip install tensorboard
1.14
pip install imgaug
升级:
python3 -m pip install --upgrade pip -i https://pypi.tuna.tsinghua.edu.cn/simple

python3 train.py --model_def config/yolov3-custom.cfg --data_config config/custom.dat
解压:
unzip dd2.zip
强制删除文件
rm txt -rf
运行中:
在这里插入图片描述
在这里插入图片描述

因为在自己的ubuntu上面跑实在慢炸天,一百张图片超过两个小时?老师给了一个集群服务器的账号,大概还是自己太笨,弄了三天才能把之前跑成功的代码在服务器上跑成功。
用的是:浪潮AiStation智能计算平台
http://svrproject.tpddns.net/aistation/howto.html

一开始一直在折腾shell无法登录,后来仔细看平台文档才知道自己写错了主机名,而且使用开发环境根本不需要用到xshell…
过程:
1.登录web平台可视化的网站
2.新建开发环境,选择镜像(自己选的是pytorch,但不清楚不同版本的区别)
在这里插入图片描述
3.文件管理中上传自己本地的压缩文件,用命令进行压缩(不用命令的话无法压缩成功)
4.在开发环境详情里进入shell终端
在这里插入图片描述
jupyter里面可以自由地编辑文件,记得点击保存
shell终端里面安装好需要的库(自己先升级了pip然后安装了一个img之类的包) 很多其他的包环境里面都配置好了,很方便。
训练了一百个epoch:
python3 detect.py --image_folder data/custom/dd --model_def config/yolov3-custom.cfg --class_path data/custom/classes.names --checkpoint_model checkpoints/yolov3_ckpt_99.pth --weights_path checkpoints/yolov3_ckpt_99.pth
在这里插入图片描述
另外checkpoint的pth文件无法在服务器里打开,大概要下载到自己电脑上才行。
下一步打算更新数据集了。

文件夹只能在终端强制删除:

# cd /hexinyi
# cd PyTorch-YOLOv3/data
# ls
coco  coco.names  custom  get_coco_dataset.sh  samples
# cd custom
# rm images
rm: cannot remove 'images': Is a directory
# rm images -r
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值