贝叶斯优化优化参数，以Kmeans为例

最新推荐文章于 2024-05-02 01:43:14 发布

呆萌的代Ma

最新推荐文章于 2024-05-02 01:43:14 发布

阅读量1.2k

点赞数 1

分类专栏：数据分析

本文为CSDN博主"呆萌的代Ma"原创文章，转载请注明博客链接：https://blog.csdn.net/weixin_35757704/

本文链接：https://blog.csdn.net/weixin_35757704/article/details/118480135

版权

贝叶斯优化 KMeans 聚类轮廓系数参数调优

关键词由CSDN通过智能技术生成

数据分析专栏收录该内容

14 篇文章 1 订阅

订阅专栏

贝叶斯优化有几个步骤：

构造黑盒目标函数
确定取值空间
构造贝叶斯优化器

下面以kmeans为例：

步骤一：构造黑盒目标函数

这个函数主要是运行需要的函数，然后使用计算一个指标（只能是一个指标哈！），然后贝叶斯优化会在迭代的时候最大化这个指标，如果需要最小化这个指标，则可以在目标值前面加一个负号

def f_score(n_clusters, n_init, my_iter):
    k_means = KMeans(n_clusters=int(n_clusters), n_init=int(n_init), max_iter=int(my_iter))
    k_means.fit(data)
    if k_means.labels_.max() == -1 or k_means.labels_.max() == 0 or \
            k_means.labels_.max() == k_means.labels_.shape[0] - 1:
        return -1
    score = metrics.silhouette_score(data, k_means.labels_, metric='euclidean')  # 使用轮廓系数作为最终指标，最大化轮廓系数
    return score  # 最后要输出一个指标，贝叶斯优化器会尝试最大化这个指标

步骤二：确定取值空间

这个主要是确定搜索值的范围的：[最小，最大]

    pbounds = {'n_clusters': (4, 20),
               'n_init': (5, 20),
               'my_iter': (200, 500), }

步骤三：构造贝叶斯优化器

    optimizer = BayesianOptimization(
        f=f_score,  # 黑盒目标函数
        pbounds=pbounds,  # 取值空间
        verbose=2,  # verbose = 2 时打印全部，verbose = 1 时打印运行中发现的最大值，verbose = 0 将什么都不打印
        random_state=1,
    )

全部代码

import pandas as pd
import numpy as np
from sklearn import metrics
from bayes_opt import BayesianOptimization
from sklearn.cluster import KMeans


# 步骤一：构造黑盒目标函数
def f_score(n_clusters, n_init, my_iter):
    k_means = KMeans(n_clusters=int(n_clusters), n_init=int(n_init), max_iter=int(my_iter))
    k_means.fit(data)
    if k_means.labels_.max() == -1 or k_means.labels_.max() == 0 or \
            k_means.labels_.max() == k_means.labels_.shape[0] - 1:
        return -1
    score = metrics.silhouette_score(data, k_means.labels_, metric='euclidean')  # 使用轮廓系数作为最终指标，最大化轮廓系数
    return score  # 最后要输出一个指标，贝叶斯优化器会尝试最大化这个指标


if __name__ == '__main__':
    data = pd.DataFrame(data=np.random.randint(0, 10, size=(2000, 10))) # 生成数据
    # 步骤二：确定取值空间
    pbounds = {'n_clusters': (4, 20),
               'n_init': (5, 20),
               'my_iter': (200, 500), }
    # 步骤三：构造贝叶斯优化器
    optimizer = BayesianOptimization(
        f=f_score,  # 黑盒目标函数
        pbounds=pbounds,  # 取值空间
        verbose=2,  # verbose = 2 时打印全部，verbose = 1 时打印运行中发现的最大值，verbose = 0 将什么都不打印
        random_state=1,
    )
    # 开始运行
    optimizer.maximize(  # 运行
        init_points=10,  # 随机搜索的步数
        n_iter=50,  # 执行贝叶斯优化迭代次数
    )
    print(optimizer.max['params'])  # 最优参数
    print(optimizer.max['target'])  # 最优值

输出为：

{'my_iter': 235.44227635380747, 'n_clusters': 19.807354168254797, 'n_init': 17.245557591846417}
0.08350507522285436

呆萌的代Ma

关注

1
点赞
踩
17

收藏

觉得还不错? 一键收藏
打赏
0
评论
贝叶斯优化优化参数，以Kmeans为例

文章目录步骤一：构造黑盒目标函数步骤二：确定取值空间步骤三：构造贝叶斯优化器全部代码贝叶斯优化有几个步骤：构造黑盒目标函数确定取值空间构造贝叶斯优化器下面以kmeans为例：步骤一：构造黑盒目标函数这个函数主要是运行需要的函数，然后使用计算一个指标（只能是一个指标哈！），然后贝叶斯优化会在迭代的时候最大化这个指标，如果需要最小化这个指标，则可以在目标值前面加一个负号def f_score(n_clusters, n_init, my_iter): k_means = KMeans
复制链接

扫一扫