Hyperopt的使用

最新推荐文章于 2024-04-16 21:58:00 发布

ruskeeyao

最新推荐文章于 2024-04-16 21:58:00 发布

阅读量3.4k

点赞数 2

分类专栏： python 机器学习文章标签：机器学习优化

本文链接：https://blog.csdn.net/u014084065/article/details/78543523

版权

Hyperopt是一个基于贝叶斯优化的Python库，用于调整机器学习模型的参数。它提供fmin函数来寻找最优参数空间，如hp.choice、hp.randint等用于定义参数搜索空间。Trials对象记录每次试验的参数和结果。注意，对于分类任务，需要正确处理评分标准，如取负数以最小化损失。Hyperas是Hyperopt的便捷包装器，简化模型定义和参数调整。

摘要由CSDN通过智能技术生成

对于机器学习工程师，要选择使用的模型，也要调整各个模型的参数，才找到最好的匹配。即使模型还可以，如果它的参数设置不匹配，同样无法输出好的结果。
常用的调参方式有 grid search 和 random search ，grid search 是全空间扫描，所以比较慢，random search 虽然快，但可能错失空间上的一些重要的点，精度不够，于是，贝叶斯优化出现了。
hyperopt是一种通过贝叶斯优化来调整参数的工具，对于像XGBoost这种参数比较多的算法，可以用它来获取比较好的参数值。

安装

pip install hyperopt

它会安装 networkx，如果运行异常，碰到 TypeError: 'generator' object is not subscriptable 的话，可以卸载并换成老版本来解决

pip uninstall networkx
pip install networkx==1.11

几个重要的函数，变量和概念

fmin

from hyperopt import fmin, tpe, hp
best = fmin(
    fn=lambda x: x,
    space=hp.uniform('x', 0, 1),
    algo=tpe.suggest,
    max_evals=100)
print best

以上面的函数为例，fmin寻找最佳匹配的 space ，使 fn 的函数返回值最小，采用了 tpe.suggest (tree of Parzen estimators) 的算法，反复尝试100次，最终得到的结果类似于 {'x': 0.000269455723739237}

space

对于变量的变化范围与取值概率，一般定义有这么几个

hp.choice(label, options) where options should be a python list or tuple. 如果需要枚举从[1, 100]，那么用choice，而不应该用quniform
hp.randint(label, upper) 返回从[0, upper)的随机整数，一般用作随机数的种子值。如果这个值会影响loss函数，那么需要考虑使用 quniform
hp.uniform(label, low, high) where low and high are the lower and upper bounds on the range. 限制上下边界的平均分布
hp.quniform(label, low, high) where low and high are the lower and upper bounds on the range. 但只取整数(round)， ${\lfloor}{\frac{{[low, high]}}{q}{\rfloor}} \times {q}$ 。返回可能是 1.0 这样的数值，如果参数类型有Interger的限制ÿ

最低0.47元/天解锁文章

ruskeeyao

关注

2
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
Hyperopt的使用

对于机器学习工程师，要选择使用的模型，也要调整各个模型的参数，才找到最好的匹配。即使模型还可以，如果它的参数设置不匹配，同样无法输出好的结果。常用的调参方式有 grid search 和 random search ，grid search 是全空间扫描，所以比较慢，random search 虽然快，但可能错失空间上的一些重要的点，精度不够，于是，贝叶斯优化出现了。 hyperopt是一种通
复制链接

扫一扫

专栏目录