![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
实验
文章平均质量分 63
吃住都在网吧
这个作者很懒,什么都没留下…
展开
-
今日实验总结
使用浪潮AI Station:(1)显存占用率满了,但是GPU使用率为0,可能是卡子被其他人在使用;(2)在“开发环境”里面调试,然后安装自己需要的包,把镜像保存;在“训练管理”里面提交训练任务,把之前的镜像再导入;(3)通常分配的GPU是一块,os.environ[“CUDA_VISIBLE_DEVICES”] = "0"即可;(4)缺失的链接文件libboost_thread.so.1.58.0和libboost_system.so.1.58.0在调试阶段可以放入当前文件夹,在训练时候可以放入/原创 2021-04-01 20:57:30 · 251 阅读 · 0 评论 -
今日实验总结2
(1)为什么同样的代码在两个不同机子上报不同的错,一个属性错误,明明初始化的时候就已经把模型加载了,进程名称换了重新提交之后又没有报错了,玄学…(2)另一台机器为毛三个进程永远只跑第一个,是因为内存太小的原因吗,只有3G,反正这两种方式都不行;同样的代码以前也没问题,还是GPU跑的; for t in processes: t.start() t.join() for t in processes: t.start()原创 2021-04-02 21:16:44 · 259 阅读 · 0 评论 -
今日实验总结3
一、tf.ConfigProto和tf.GPUOptions用法tf.ConfigProto一般用在创建session的时候,用来对session进行参数配置,而tf.GPUOptions可以作为设置tf.ConfigProto时的一个参数选项,一般用于限制GPU资源的使用。1.1 tf.ConfigProto()的参数log_device_placement=True : 是否打印设备分配日志allow_soft_placement=True : 如果你指定的设备不存在,允许TF自动分配设备1原创 2021-04-08 20:55:32 · 249 阅读 · 0 评论