总结一下昨天与今天的学习程序
前天使用TensorFlow的分布式函数编写分布式程序,一直困惑不能结束死循环,不能在设定的步骤范围内停止
昨天调了半天CNN架构的mnist程序,一直不能分布式执行,在那个配置比较差的机器上跑ps与wk,单个来跑CNN程序,结果失败,导致容器崩溃,姑且认为是内存与CPU配置过低不能承载程序
换个思路,找了一个简单的mnist程序,改变成分布式程序,两个都能分布式运行,这里就认为是内存与CPU配置过低不能承载过于频繁迭代的程序
但是还是不能解决在规定的循环步骤范围内结束程序的运行。。。。。
换个思路,将网上GitHub上的测试代码,下载、修改循环次数,上传,再下载到容器中,执行还是不能跳出循环,,,,此时我的内心是奔溃的奔溃的奔溃的
只能暂时搁浅。。。。。
本来想着在本主机虚拟机上装一个新的cenos7系统,或者再装一个硬盘装一个双系统,后来一想,直接在Aneka主机上装一个算了,保险、可随意删增(自己电脑上资料不会丢失)
本来想着直接用命令一行一行的敲,后来觉得还是写个脚本一劳永逸解决增加从节点的途径,所以重新写一个增加docker集群的脚本,逻辑写好了,待测中
(中午又办点事,一会儿再去参加一个室友的生日,就不能测试了。。。感觉一天效率好低。。。)