机器学习参数与超参及超参调优

最新推荐文章于 2024-07-05 09:09:44 发布

起名字什么的好难

最新推荐文章于 2024-07-05 09:09:44 发布

阅读量1.9k

点赞数 1

分类专栏：人工智能

本文链接：https://blog.csdn.net/u012428169/article/details/115185636

版权

人工智能专栏收录该内容

37 篇文章 1 订阅

订阅专栏

参数

定义：模型内部的配置变量，可以用数据估计它的值。

特征：

进行模型预测时需要模型参数。
模型参数值可以定义模型功能。
模型参数用数据估计或数据学习得到。
模型参数一般不由实践者手动设置。
模型参数通常作为学习模型的一部分保存。

例子：

人造神经网络中的权重。
支持向量机中的支持向量。
线性回归或逻辑回归中的系数。

超参数

定义：模型外部的配置，其值不能从数据估计得到。

特征：

模型超参数常应用于估计模型参数的过程中。
模型超参数通常由实践者直接指定。
模型超参数通常可以使用启发式方法来设置。
模型超参数通常根据给定的预测建模问题而调整。

例子：

训练神经网络的学习速率。
支持向量机的C和sigma超参数。
k邻域中的k。
网络结构，包括神经元之间的连接关系、层数、每层的神经元数量、激活函数的类型。
优化参数，包括优化方法、学习率、小批量的样本数量。
正则化系数

模型参数是根据数据自动估算的。但模型超参数是手动设置的，并且在过程中用于帮助估计模型参数。

超参数优化方法

网格搜索

通过尝试所有超参数的组合来寻址合适一组超参数配置的方法。根据这些超参数的不同组合方式分别训练一个模型，然后测试这些模型在开发集上的性能，选取一组性能最好的配置。
详细解释和代码可以参考超参数优化和机器学习模型的超参数优化。

随机搜索

对超参数进行随机组合，然后选择一个性能最好的配置。在超参数网格的基础上选择随机的组合来进行模型训练。随机寻优方法找到最优参数的机会相对更高，但是这一方法适用于低维数据的情况，可以在较少迭代次数的情况下找到正确的参数集合，并且花费的时间较少。
详细解释和代码可以参考机器学习模型的超参数优化和超参数优化。

贝叶斯优化

自适应的超参数搜索方法，根据当前已经试验的超参数组合，来预测下一个可能带来最大收益的组合。通过构造一个函数的后验分布（高斯过程）来工作的，该后验分布最好地描述了要优化的函数。随着观测次数的增加，后验分布得到改善，算法更加确定参数空间中哪些区域值得探索，哪些区域不值得探索。
详细解释可参考深度学习之10——超参数优化、机器学习模型的超参数优化和超参数优化，代码可参考4种主流超参数调优技术。

动态资源分配

一种有效方法是逐次减半(successive halving)，将超参数优化看作是一种非随机的最优臂问题，假设要尝试N组超参数配置，总共可利用的资源预算为B，我们可以通过 $T = [log_2(N)-1]$ 轮逐次减半的方法来选取最优的配置。
详细解释可参考深度学习之10——超参数优化。

神经架构搜索

通过神经网络来自动实现网络架构的设计。一个神经网络的架构可以用一个变长的字符串来描述。利用元学习的思想，神经架构搜索利用一个控制器来生成另一个子网络的架构描述。控制器可以由一个循环神经网络来实现。控制器的训练可以通过强化学习来完成，其奖励信号为生成的子网络在开发集上的准确率。
详细解释参考深度学习之10——超参数优化。