前言
- 有复现需要的时候建议全部指定random_state
- 不收敛的时候指定一下max_iter
logistics regression
model = LogisticRegression(C=my_c, max_iter=500, random_state=0)
重要参数:
- C
默认L2正则化,默认优化器的情况下,基本只有个C可以调。
svm
重要参数:
- C:惩罚系数的相反数(如上图),C越大越容易过拟合,C越小越容易欠拟合
- kernel: linear,poly , rbf, 其中rbf就是高斯
- degree: 仅适用于poly,poly的最高次数
- gamma:仅适用于rbf。gaussian kernel的参数(linear 和poly就没有这个),如下图.gamma越大,σ越小,使得高斯分布又高又瘦,造成模型只能作用于支持向量附近,可能导致过拟合;反之,gamma越小,σ越大,高斯分布会过于平滑,在训练集上分类效果不佳,可能导致欠拟合。
knn
参考链接:https://www.cnblogs.com/listenfwind/p/10685192.html
重要参数:
- k: knn的k,选几个最近的邻居。太小容易过拟合,太大有问题。
weights(权重): 三个选项:'distance" 表示距离近的邻居权重大;'uniform’表示远近都一样;自定义函数