表 4 超参的默认值以及取值范围

    • 当前各个超参数设置的默认值和取值范围如下:

      表 4 超参的默认值以及取值范围

      算子

      超参(默认值)

      取值范围

      超参描述

      GD:

      logistic_regression、linear_regression、svm_classification、pca

      optimizer = gd(梯度下降法)

      gd/ngd(自然梯度下降)

      优化器

      verbose = false

      T/F

      日志显示

      max_iterations = 100

      (0, 10000]

      最大迭代次数

      max_seconds = 0 (不对运行时长设限制)

      [0,INT_MAX_VALUE]

      运行时长

      batch_size = 1000

      (0, 1048575]

      一次训练所选取的样本数

      learning_rate = 0.8

      (0, DOUBLE_MAX_VALUE]

      学习率

      decay = 0.95

      (0, DOUBLE_MAX_VALUE]

      权值衰减率

      tolerance = 0.0005

      (0, DOUBLE_MAX_VALUE]

      公差

      seed = 0(对seed取随机值)

      [0, INT_MAX_VALUE]

      种子

      just for linear、SVM:kernel = "linear"

      linear/gaussian/polynomial

      核函数

      just for linear、SVM:components = MAX(2*features, 128)

      [0, INT_MAX_VALUE]

      高维空间维数

      just for linear、SVM:gamma = 0.5

      (0, DOUBLE_MAX_VALUE]

      gaussian核函数参数

      just for linear、SVM:degree = 2

      [2, 9]

      polynomial核函数参数

      just for linear、SVM:coef0 = 1.0

      [0, DOUBLE_MAX_VALUE]

      polynomial核函数的参数

      just for SVM:lambda = 0.01

      (0, DOUBLE_MAX_VALUE)

      正则化参数

      just for pca: number_components

      (0,INT_MAX_VALUE]

      降维的目标维度

      GD:

      multiclass

      classifier="svm_classification"

      svm_classification\logistic_regression

      多分类任务的分类器

      Kmeans

      max_iterations = 10

      [1, 10000]

      最大迭代次数

      num_centroids = 10

      [1, 1000000]

      簇的数目

      tolerance = 0.00001

      (0,1]

      中心点误差

      batch_size = 10

      [1,1048575]

      一次训练所选取的样本数

      num_features = 2

      [1, INT_MAX_VALUE]

      输入样本特征数

      distance_function = "L2_Squared"

      L1\L2\L2_Squared\Linf

      正则化方法

      seeding_function = "Random++"

      "Random++"\"KMeans||"

      初始化种子点方法

      verbose = 0U

      { 0, 1, 2 }

      冗长模式

      seed = 0U

      [0, INT_MAX_VALUE]

      种子

      xgboost:

      xgboost_regression_logistic、

      xgboost_binary_logistic、

      xgboost_regression_gamma、xgboost_regression_squarederror

      n_iter=10

      (0, 10000]

      迭代次数

      batch_size=10000

      (0, 1048575]

      一次训练所选取的样本数

      booster="gbtree"

      gbtree\gblinear\dart

      booster种类

      tree_method="auto"

      auto\exact\approx\hist\gpu_hist

      注意:gpu_hist参数需要相应的库GPU版本,否则DB4AI平台不支持该值。

      树构建算法

      eval_metric="rmse"

      rmse\rmsle\map\mae\auc\aucpr

      验证数据的评估指标

      seed=0

      [0, 100]

      种子

      nthread=1

      (0, MAX_MEMORY_LIMIT]

      并发量

      max_depth=5

      (0, MAX_MEMORY_LIMIT]

      树的最大深度,该超参仅对树型booster生效。

      gamma=0.0

      [0, 1]

      叶节点上进行进一步分区所需的最小损失减少

      eta=0.3

      [0, 1]

      更新中使用的步长收缩,以防止过拟合

      min_child_weight=1

      [0, INT_MAX_VALUE]

      孩子节点中所需的实例权重的最小总和

      verbosity=1

      0 (silent)\1 (warning)\2 (info)\3 (debug)

      打印信息的详细程度

      MAX_MEMORY_LIMIT = 最大内存加载的元组数量

      GS_MAX_COLS = 数据库单表最大属性数量

  • 模型保存成功,则返回创建成功信息:

    MODEL CREATED. PROCESSED x
  • 9
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值