mxnet在多显卡训练u-net中的坑

此刻,我热泪盈眶,因为我晚上做梦都在思考的bug解决了,解决了,解决了,此处要实名感谢的我师傅:冯师傅---不知道踩过多少坑的冯师傅(好想抱抱她)。。。呃,言归正传,具体情况一一交代。

背景:mxnet框架下u-net多分类,双卡1080服务器,ubuntu系统

错误类型:

截图不完整,大致的意思就是需要的数据类型是[8,3,256,256],提供的源数据类型是[4,3,256,256],最开始的8是因为设置的batch_size=8,那4嘞,咋来的?最开始怀疑数据格式不对,检查了3+遍证明没问题,又怀疑是迭代器造成的,检查了7+遍,在网上找别人的代码,也是没发现原因。7.3中午出现的bug晚上下班还没有解决,于是乎,我超级不淡定了,晚上回家接着看,还找来搞医疗方向的朋友帮我看,虽然人家搞过一段时间的深度学习,但是用的框架是caffe,搞到凌点,愣愣的是没解决,好吧,看来还是不够认真,于是乎,第二天接着找资料~挠头~找资料~挠头,在头发快被我薅完之际,决定厚着脸皮请教我的冯老师(因为总是麻烦她),她看了bug就说应该是两张显卡平分了一个batch,虽然batch_size=8,但是平分到一张显卡上就是4,这跟网络模型设置不一致。纳尼~还能这样

改进就是把Reshape(batch_size,channels,w,h)改成Reshape(-1,channels,w,h),这样显卡自动计算,保证原来的batch_size不变,ctx = [cpu(0),cpu(1)]

不要放过任何一个小细节

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值