代码写作套路【2】实验进行中

Doris404

已于 2022-06-08 11:15:06 修改

阅读量213

点赞数 1

分类专栏：套路文章标签： python

于 2021-09-22 14:58:21 首次发布

本文链接：https://blog.csdn.net/kullollo/article/details/119758073

版权

套路专栏收录该内容

16 篇文章 0 订阅

订阅专栏

在这里插入图片描述

实验中的代码写作至关重要，好的写作习惯有助于项目的推进，从而帮助实验者减少花费在实验上的时间。

命名

推荐使用时间戳命名法：时间戳+数据+具体细节。同时文件存储在所在日期到文件夹下方便进行管理。

# timestamp是日期为名的文件夹，id_是时间标识用于文件命名
import datetime
from datetime import timezone, timedelta

timestamp = datetime.datetime.now().astimezone(timezone(timedelta(hours=8))).strftime("%Y%m%d/")
id_ = datetime.datetime.now().astimezone(timezone(timedelta(hours=8))).strftime("%Y%m%d-%H%M%S")

# model_save
# pytorch
torch.save(model,'model'+id)
# tensorflow
model.save('model'+id_+'.h5')

# model_load
# pytorch
model = torch.load(model_path)
# tensorflow
model = tensorflow.keras.models.load_model(model_path)

项目结构

详见博客：代码写作套路【4】项目文件夹构建

参数

模型训练与测试所需要的参数众多。以模型测试实验的参数为例，模型测试实验中的参数包括，所选择的模型，测试数据，测试规模等等。使用常规的方法每次测试都要向测试代码中输入参数较为麻烦。使用argparse包可以简化每次训练的过程。

# parse
import argparse
parser = argparse.ArgumentParser()
parser.add_argument("--test_query_size", help="number of query for test model", type=int, default=100)
parser.add_argument("--original_data", help="the csv file we play ce on",type=str, default='forest10.csv')
parser.add_argument("--model", help = 'the model you want to test')
args = parser.parse_args()

test_query_size = args.test_query_size
data = pd.read_csv(args.original_data)
model = tf.keras.models.load_model(args.model)

parse展示了实验案例

pdb调试

pdb调试工具可以帮助我们快速解决bug。

# pdb
import pdb
'''your code'''
pdb.set_trace()
'''your code'''

在终端中运行python代码时，可以运行python -m pdb [your py]可以得到相同的效果。

模型细节查看

这部分可以参考代码阅读套路【1】中的内容，先将模型加载出来（或是训练出来），然后调用下面语句，查看这个模型的可选属性有哪些。

print(model.__dict__) # 查看有哪些模型细节可以查看
for name, parameters in model.named_parameters(): # 查看模型参数
 	print(name, ':', parameters)

实验跑得很慢怎么办

有时候实验跑的太慢也会成为阻碍实验继续进行的一个因素，这时候可以考虑以下几个解决方案

从cpu换到gpu
从一个device到另一个device
不使用虚拟环境

实验结果下载

实验结果命名时要遵循统一命名规则，这样方便下载实验结果。

# 将所有名字中含有xbhat的文件移动到tmp
find -name "*xbhat*" | xargs -I file mv file tmp

参考博客Linux 移动文件名含有特定字段的文件

空间预算与解决

在使用阿里云时时常发生服务器存储空间不够的情况，这个时候可以通过ln方法建立链接，将文件夹链接到临时空间中。

df -hl

请添加图片描述
可以发现/dev,/dev/shm拥有很大空间，可以用于存储实验结果，进行完实验后将结果立刻下载到本地（重启服务器后存在临时硬盘的内容会消失）。

ln -s [link_to_folder] tmp

运行上述代码，则可以在文件夹下新建立tmp文件夹，并将tmp链接至临时空间。

Doris404

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
代码写作套路【2】实验进行中

实验中的代码写作至关重要，好的写作习惯有助于项目的推进，从而帮助实验者减少花费在实验上的时间。实验代码分类实验代码可以分成三大类：模型训练代码模型测试代码数据处理代码：更改数据表现形式实验中关注的问题模型存储与加载实验中核心代码产生的实验结果应该以全局唯一方式命名，下面介绍最简单的一种实验结果命名方式：时间戳。# timestamp import datetimeid_ = datetime.datetime.now().strftime("%Y%m%d-%H%M%S")t.
复制链接

扫一扫

专栏目录