Mindspore冻结参数

最新推荐文章于 2024-07-19 14:41:13 发布

YIHII

最新推荐文章于 2024-07-19 14:41:13 发布

阅读量286

点赞数

文章标签：深度学习人工智能机器学习华为 Powered by 金山文档

本文链接：https://blog.csdn.net/YIHII/article/details/129378193

版权

做过pytorch框架下机器学习的人，应该或多或少都知道pytorch框架下训练模型是基于tensor的。所以在冻结参数时通常需要两步操作，首先设置模型中想要冻结的参数的requires_grad属性为Fasle，然后在优化器中把想要冻结的参数去掉，或者说只将想训练的的权值提供给优化器。

但mindspore下是通过全图梯度计算实现训练的，所以如果希望冻结参数，只需要把想要训练的参数给到优化器以及求梯度的函数grad即可。

其中grad在当前的mindspore2.0.0alpha版本中是mindspore.grad()函数，一般是在TrainOneStepCell中使用。

一般在训练的时候如果希望模型能返回除了loss之外的其他值，需要使用到has_aux参数，然后把所有的loss加和到一个loss变量中，放在返回值的第一个位置。

weights就是放参数的地方，一般通过trainable_params()函数获取，返回的是一个参数列表，多个参数列表直接通过+运算符连接起来就可以了。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

YIHII

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

yolo4参数和模型的对应详细说明，一看就懂系列

pvmsmfchcs的博客

01-27

941

自带的分类和模型的的对应关系 coco_classes.txt yolo4.weight.pth voc_classes.txt yolo4_voc_weigths.pth TS_classes.txt Epoch100-Total_Loss3.8129-Val_Loss5.0751.pth 自带predict.py调用nets/yolo4.py train.py做训练模型使用参数说明： lr：学习率 Batch_size：批处理尺寸，几张图片更新一次参数 Init_Epoch：起始记书数 Freeze

昇思25天学习打卡营第11天|基于MindSpore通过GPT实现情感分类

数字人生

06-29

1155

【代码】基于MindSpore通过GPT实现情感分类。

参与评论您还未登录，请先登录后发表或查看评论

【MindSpore产品】【模型部分参数冻结功能】mindspore如何固定住部分层的可训练参数

weixin_45666880的博客

06-23

295

问题描述：mindspore如何固定住部分层的可训练参数？ layer.trainable = False, 的等效实现是怎样的？求大佬解答。猜测是set_train，但是文档解释并不清晰，“另一个分支”不太理解是啥？已解决：示例如下解答：建议参考下这里https://mindspore.cn/tutorials/zh-CN/r1.7/advanced/network/optim.html?highlight=%E4%BC%98%E5%8C%96%E5%99%A8#%E5%8F%82%E6%95%B

mindspore官网教程中冻结网络参数怎么理解，能否解释下？

weixin_45666880的博客

07-18

207

官方教程（使用MobileNetV2网络实现微调）中冻结网络参数怎么理解，求解答。，这样，在后续的训练中，网络所有参数将保持固定值，不再更新。冻结既为将网络中所有参数的。

昇思MindSpore2.3版本正式上线，增强动/静态图与大模型能力

最新发布

Kenji_Shinji的博客

07-19

773

经过昇思MindSpore社区开发者们几个月的开发与贡献，现正式发布昇思MindSpore2.3版本，其中动态图开发支持算子直调提升API性能，静态图开发支持O(n)多级编译提升调试调优能力，在大模型训练方面，支持大模型场景计算与通信掩盖的极致优化，并新增接口FlopsUtilizationCollector，提供算力利用率统计能力，在大模型推理方面，推出针对LLM的推理优化方案提升推理性能，MindSpore Transformers提升推理性能与易用性，在科学计算套件方面，MindSpore Flow新

pytorch——冻结某层参数

北国觅梦

12-11

6400

参考链接： https://blog.csdn.net/qq_41368074/article/details/107860126 https://blog.csdn.net/Code_Mart/article/details/88254444 首先，我们知道，深度学习网络中的参数是通过计算梯度，在反向传播进行更新的，从而能得到一个优秀的参数，但是有的时候，我们想固定其中的某些层的参数不参与反向传播。比如说，进行微调时，我们想固定已经加载预训练模型的参数部分，指向更新最后一层的分类器，这时应该怎么做呢

MindSpore如何只训练某一层参数

BaldheadedM的博客

07-27

379

如果我只想训练网络resnet的最后一层全连接，前面层固定参数，应该怎么做。（可选，上传日志内容或者附件）

pytorch冻结参数训练的坑

lishanlu136的博客

09-22

1175

pytorch冻结层遇到的坑，冻结Batchnorm层

MindSpore模型精度调优实践

吴建明wujianming_110117

02-07

203

MindSpore模型精度调优实践引子：在模型的开发过程中，精度达不到预期常常让人头疼。为了帮助用户解决模型调试调优的问题，为MindSpore量身定做了可视化调试调优组件：MindInsight。还梳理了针对常见精度问题的调试调优指南，将以“MindSpore模型精度调优实战”系列文章的形式分享出来，希望能帮助用户轻松定位精度问题，快速优化模型精度。本文是系列分享的第一篇，将分析精度问题的常见现象和原因，并给出一个整体的调优思路。本系列分享假设您的脚本已经能够运行并算出loss值。如果脚本还不能运行，

使用MindSpore训练模型中精度问题的常见现象

xi_xiyu的博客

07-04

569

模型精度问题和一般的软件问题不同，定位周期一般也更长。在通常的程序中，程序输出和预期不符意味着存在bug（编码错误）。但是对一个深度学习模型来说，模型精度达不到预期，有着更复杂的原因和更多的可能性。常见现象：精度问题的直接现象一般体现在loss（模型损失值）和metrics（模型度量指标）上。loss现象一般表现为：（1）loss跑飞，出现NAN，+/- INF，极大值（2）loss不收敛、收敛慢（3）loss为0等。模型metrics一般表现为模型的accuracy、pre

昇思25天学习打卡营第6天|MindSpore-ResNet50迁移学习

pblh123的专栏

06-30

513

基于MindSpore-ResNet50模型进行迁移学习，实现狼狗与狗的分类预测。熟悉迁移学习方式，参数冻结微调，预训练模型使用

7月21日！昇思开发者创享日暨MSG企业行走进宁波，探索大模型如何破局产业智能化

weixin_54284479的博客

07-14

205

目前已经孵化紫东.太初、武汉.LuoJia、CodeGeeX等多个AI大模型。，邀您共同探讨当前AI开源生态现状、什么是好的AI开源生态、如何打造好的AI开源生态，分享行业大模型发展现状与技术落地、优化方法论，并以算力基础设施支撑生态发展、大模型在工业的落地相关案例，见证昇思在打造全开放AI开源生态走出的一大步。大模型已经成为全球科技竞争的“高地”，是否拥有大模型将成为科技巨头与其他科技平台企业的重要分水岭，基础大模型将呈现激烈的竞争格局，作为业界目光汇聚的焦点，成为新一代流量入口。

华为开源自研AI框架昇思MindSpore应用案例：基于MindSpore框架的UNet-2D案例实现

Yeats_Liao的博客

08-14

2324

华为开源自研AI框架昇思MindSpore应用案例：基于MindSpore框架的UNet-2D案例实现

昇思MindSpore详细教程

IT菜鸟

02-18

1703

给MindSpore添加一个新的硬件后端(device target)如何给MindSpore添加一个新的硬件后端？快速构建测试环境！如何给MindSpore添加一个新的硬件后端？快速构建测试环境！MindSpore支持异构算力，除支持华为自研的达芬奇架构的Ascend NPU外还支持CPU(e.g. MKLDNN) 以及 GPU(e.g. CUDA kernels)算子的运行。注意。

昇思MindSpore（r1.9）源码编译安装

IT菜鸟

02-21

664

源码编译MindSpore（Ascend910版本）

昇思25天学习打卡营第一天：通过MindSpore的API来快速实现一个简单的深度学习模型

wanmeijuhao的博客

06-25

888

昇思MindSpore是一个全场景深度学习框架，由华为公司开发并开源。它提供了易于使用、高效灵活和云边端协同的AI开发能力，支持全场景AI应用。MindSpore通过动态图、静态图、原生算子融合、自动微分等特性，支持数据科学家和AI工程师高效地进行模型训练、评估和推理。昇腾计算，是基于昇腾系列处理器构建的全栈AI计算基础设施及应用，包括昇腾Ascend系列芯片、Atlas系列硬件、CANN芯片使能、MindSpore AI框架、ModelArts、MindX应用使能等。

Bert模型冻结指定参数

dzysunshine的博客

04-27

3911

bert模型做微调有的时候就需要只训练部分参数，那么就需要把其他的参数冻结掉，固定住，又能微调bert模型，还能提高模型训练的效率。这个就需要用到parameter的requires_grad的属性，来冻结和放开参数。比如说现在我们要放开第11和12层以及bert.pooler和out层参数，冻结其他的参数，怎么实现呢？ pytorch中有 model.named_parameters() 和 requires_grad，直接写一个遍历然后设置就好。具体实现代码： import torch.nn as

【MindSpore易点通】如何实现梯度不回传以及梯度回传后不更新权重功能

Kenji_Shinji的博客

11-07

1221

梯度更新的中心思想沿着loss函数梯度的方向更新权重以让loss函数的值最小化或accuracy最大化，在示例代码中使用requires_grad与stop_gradient方法实现禁止conv1层梯度更新。用户在使用深度学习网络结构执行开发任务时，难免会遇到一些代码上看上去很正常，而且代价函数也在不断减小，但是因为不知道的bug存在，使得我们得到的神经网络并不是最优解。requires_grad:bool类型，当值为True时表面该参数需要更新，反之则不需更新。

pytorch 冻结参数

07-28

PyTorch中的CrossEntropyLoss函数有两个参数：weight和ignore_index。 weight参数是一个1D张量，用于为每个类别指定权重。如果不需要权重，则可以将其设置为None。 ignore_index参数是一个整数，用于指定忽略的...