表 4 超参的默认值以及取值范围

最新推荐文章于 2024-06-28 11:42:37 发布

ikeseo.cn

最新推荐文章于 2024-06-28 11:42:37 发布

阅读量662

点赞数 9

分类专栏： openGauss 文章标签： r语言机器学习支持向量机

本文链接：https://blog.csdn.net/hjgyjt/article/details/139905066

版权

openGauss 专栏收录该内容

237 篇文章 0 订阅

订阅专栏

当前各个超参数设置的默认值和取值范围如下：

表 4 超参的默认值以及取值范围

算子	超参(默认值)	取值范围	超参描述
GD: logistic_regression、linear_regression、svm_classification、pca	optimizer = gd（梯度下降法）	gd/ngd（自然梯度下降）	优化器
	verbose = false	T/F	日志显示
	max_iterations = 100	(0, 10000]	最大迭代次数
	max_seconds = 0 (不对运行时长设限制)	[0,INT_MAX_VALUE]	运行时长
	batch_size = 1000	(0, 1048575]	一次训练所选取的样本数
	learning_rate = 0.8	(0, DOUBLE_MAX_VALUE]	学习率
	decay = 0.95	(0, DOUBLE_MAX_VALUE]	权值衰减率
	tolerance = 0.0005	(0, DOUBLE_MAX_VALUE]	公差
	seed = 0（对seed取随机值）	[0, INT_MAX_VALUE]	种子
	just for linear、SVM：kernel = "linear"	linear/gaussian/polynomial	核函数
	just for linear、SVM：components = MAX(2*features, 128)	[0, INT_MAX_VALUE]	高维空间维数
	just for linear、SVM：gamma = 0.5	(0, DOUBLE_MAX_VALUE]	gaussian核函数参数
	just for linear、SVM：degree = 2	[2, 9]	polynomial核函数参数
	just for linear、SVM：coef0 = 1.0	[0, DOUBLE_MAX_VALUE]	polynomial核函数的参数
	just for SVM：lambda = 0.01	(0, DOUBLE_MAX_VALUE)	正则化参数
	just for pca： number_components	（0，INT_MAX_VALUE]	降维的目标维度
GD: multiclass	classifier="svm_classification"	svm_classification\logistic_regression	多分类任务的分类器
Kmeans	max_iterations = 10	[1, 10000]	最大迭代次数
	num_centroids = 10	[1, 1000000]	簇的数目
	tolerance = 0.00001	(0,1]	中心点误差
	batch_size = 10	[1,1048575]	一次训练所选取的样本数
	num_features = 2	[1, INT_MAX_VALUE]	输入样本特征数
	distance_function = "L2_Squared"	L1\L2\L2_Squared\Linf	正则化方法
	seeding_function = "Random++"	"Random++"\"KMeans\|\|"	初始化种子点方法
	verbose = 0U	{ 0, 1, 2 }	冗长模式
	seed = 0U	[0, INT_MAX_VALUE]	种子
xgboost: xgboost_regression_logistic、 xgboost_binary_logistic、 xgboost_regression_gamma、xgboost_regression_squarederror	n_iter=10	(0, 10000]	迭代次数
	batch_size=10000	(0, 1048575]	一次训练所选取的样本数
	booster="gbtree"	gbtree\gblinear\dart	booster种类
	tree_method="auto"	auto\exact\approx\hist\gpu_hist 注意：gpu_hist参数需要相应的库GPU版本，否则DB4AI平台不支持该值。	树构建算法
	eval_metric="rmse"	rmse\rmsle\map\mae\auc\aucpr	验证数据的评估指标
	seed=0	[0, 100]	种子
	nthread=1	(0, MAX_MEMORY_LIMIT]	并发量
	max_depth=5	(0, MAX_MEMORY_LIMIT]	树的最大深度，该超参仅对树型booster生效。
	gamma=0.0	[0, 1]	叶节点上进行进一步分区所需的最小损失减少
	eta=0.3	[0, 1]	更新中使用的步长收缩，以防止过拟合
	min_child_weight=1	[0, INT_MAX_VALUE]	孩子节点中所需的实例权重的最小总和
	verbosity=1	0 (silent)\1 (warning)\2 (info)\3 (debug)	打印信息的详细程度
MAX_MEMORY_LIMIT = 最大内存加载的元组数量
GS_MAX_COLS = 数据库单表最大属性数量

模型保存成功，则返回创建成功信息：
```
MODEL CREATED. PROCESSED x
```

ikeseo.cn

关注

9
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
表 4 超参的默认值以及取值范围

注意：gpu_hist参数需要相应的库GPU版本，否则DB4AI平台不支持该值。MAX_MEMORY_LIMIT = 最大内存加载的元组数量。max_seconds = 0 (不对运行时长设限制)GS_MAX_COLS = 数据库单表最大属性数量。树的最大深度，该超参仅对树型booster生效。seed = 0（对seed取随机值）孩子节点中所需的实例权重的最小总和。polynomial核函数的参数。超参的默认值以及取值范围。一次训练所选取的样本数。一次训练所选取的样本数。一次训练所选取的样本数。
复制链接

扫一扫