『paddle』paddleclas 学习笔记:配置文件


简介

介绍了 PaddleClas 配置文件 (configs/*.yaml) 中各参数的含义,以便更快地自定义或修改超参数配置。

  • 注意:部分参数并未在配置文件中体现,在训练或者评估时,可以直接使用 -o 进行参数的扩充或者更新,比如说 -o checkpoints=./ckp_path/ppcls,表示在配置文件中添加(如果之前不存在)或者更新(如果之前已经包含该字段)checkpoints字段,其值设为 ./ckp_path/ppcls

配置详解

基础配置

参数名字具体含义默认值可选值
mode运行模式“train”[“train”," valid"]
checkpoints断点模型路径,用于恢复训练“”Str
last_epoch上一次训练结束时已经训练的epoch数量,与checkpoints一起使用-1int
pretrained_model预训练模型路径“”Str
load_static_weights加载的模型是否为静态图的预训练模型Falsebool
model_save_dir保存模型路径“”Str
classes_num分类数1000int
total_images总图片数1281167int
save_interval每隔多少个epoch保存模型1int
validate是否在训练时进行评估TRUEbool
valid_interval每隔多少个epoch进行模型评估1int
epochs训练总epoch数int
topk评估指标K值大小5int
image_shape图片大小[3,224,224]list, shape: (3,)
use_mix是否启用mixupFalse[‘True’, ‘False’]
ls_epsilonlabel_smoothing epsilon值0float
use_distillation是否进行模型蒸馏Falsebool

结构(ARCHITECTURE)

分类模型结构配置

参数名字具体含义默认值可选值
name模型结构名字“ResNet50_vd”PaddleClas提供的模型结构
params模型传参{}模型结构所需的额外字典,如EfficientNet等配置文件中需要传入padding_type等参数,可以通过这种方式传入

识别模型结构配置

参数名字具体含义默认值可选值
name模型结构“RecModel”[“RecModel”]
infer_output_keyinference时的输出值“feature”[“feature”, “logits”]
infer_add_softmaxinfercne是否添加softmaxTrue[True, False]
Backbone使用Backbone的名字需传入字典结构,包含namepretrained等key值。其中name为分类模型名字, pretrained为布尔值
BackboneStopLayerBackbone中的feature输出层需传入字典结构,包含namekey值,具体值为Backbone中的特征输出层的full_name
Neck添加的网络Neck部分需传入字典结构,Neck网络层的具体输入参数
Head添加的网络Head部分需传入字典结构,Head网络层的具体输入参数

学习率(LEARNING_RATE)

参数名字具体含义默认值可选值
functiondecay方法名“Linear”[“Linear”, “Cosine”,
“Piecewise”, “CosineWarmup”]
params.lr初始学习率0.1float
params.decay_epochspiecewisedecay中
衰减学习率的milestone
list
params.gammapiecewisedecay中gamma值0.1float
params.warmup_epochwarmup轮数5int
parmas.stepslineardecay衰减steps数100int
params.end_lrlineardecayend_lr值0float

优化器(OPTIMIZER)

参数名字具体含义默认值可选值
function优化器方法名“Momentum”[“Momentum”, “RmsProp”]
params.momentummomentum值0.9float
regularizer.function正则化方法名“L2”[“L1”, “L2”]
regularizer.factor正则化系数0.0001float

数据读取器与数据处理

参数名字具体含义
batch_size批大小
num_workers数据读取器 worker 数量
file_listtrain文件列表
data_dirtrain文件路径
shuffle_seed用来进行 shuffle 的 seed 值

数据处理

功能名字参数名字具体含义
DecodeImageto_rgb数据转RGB
to_np数据转numpy
channel_first按CHW排列的图片数据
RandCropImagesize随机裁剪
RandFlipImage随机翻转
NormalizeImagescale归一化scale值
mean归一化均值
std归一化方差
order归一化顺序
ToCHWImage调整为CHW
CropImagesize裁剪大小
ResizeImageresize_short按短边调整大小

mix处理

参数名字具体含义
MixupOperator.alphamixup 处理中的 alpha 值
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

libo-coder

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值