☆ 问题描述
如果想同时允许用户手动传入参数,同时也希望 Optuna 能够在函数定义中设置参数搜索空间,我们可以通过在函数内检查参数是否为 None,来决定是使用 Optuna 提供的参数值还是用户传入的参数值。
★ 解决方案
from sklearn.svm import SVC
import optuna
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
# 模拟一些数据
# X, y = ...
# 划分数据集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 定义函数并指定参数空间
def get_svm_model(trial, C: float = None, kernel: str = None) -> SVC:
# 如果参数为None,则使用trial.suggest_设置参数搜索空间
C = trial.suggest_float('C', 1e-5, 1e5, log=True) if C is None else C
kernel = trial.suggest_categorical('kernel', ['linear', 'rbf', 'poly', 'sigmoid']) if kernel is None else kernel
# 使用参数训练模型
model = SVC(C=C, kernel=kernel)
model.fit(X_train, y_train)
# 在测试集上评估模型
y_pred = model.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
return accuracy
# 创建 Optuna 试验
sampler = optuna.samplers.TPESampler(seed=42)
study = optuna.create_study(direction="maximize", sampler=sampler)
study.optimize(lambda trial: get_svm_model(trial), n_trials=100)
# 打印最优参数
best_params = study.best_params
print("Best Parameters:", best_params)
# 正常使用函数
svm_model = get_svm_model(C=1.0, kernel='rbf')