pytorch常用功能代码汇总

最新推荐文章于 2024-03-16 09:55:21 发布

yjyjjyjy1231

最新推荐文章于 2024-03-16 09:55:21 发布

阅读量229

点赞数 1

分类专栏： pytorch

本文链接：https://blog.csdn.net/qq_39055818/article/details/103863347

版权

pytorch 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

文章目录

统计网络参数量

# 所有参数量
p_all = sum([torch.numel(param) for param in model.parameters()])
# 需进行梯度更新的参数量
p_require_grad = sum([torch.numel(param) for param in model.parameters() if param.requires_grad])

统计optimizer中参数量

sum([torch.numel(param) for param in optimizer.param_groups[0]['params'] if param.requires_grad])	# 这里只考虑只有一组param

冻结网络部分参数

冻结：

for param in model.parameters():	# 设置对应的参数requires_grad = False
	param.requires_grad = False
optimizer = optim.Adam(filter(lambda p: p.requires_grad, model.parameters()), lr, [beta1, beta2])	# 在optimizer中传入需要更新梯度的参数

解冻：

for param in model.parameters():	# 设置对应的参数requires_grad = True
	param.requires_grad = True
optimizer = optim.Adam(model.parameters(), lr, [beta1, beta2])	# 在optimizer中传入模型的参数