机器学习训练营——机器学习爱好者的自由交流空间(入群联系qq:2279055353)
scikit-learn有三种不同的API评价一个模型的预测质量。
-
估计量分数方法:估计量的
score
方法,对于设计解决的问题提供了一个默认的评价准则。 -
分数参数:使用交叉验证的模型评价工具依赖一个内部的打分策略。
-
测度函数:
metrics
模块提供评价模型预测误差的函数。
分数参数:定义模型评价规则
普遍的情况:预定义值
对于大多数普遍使用的例子,你能够使用scoring
参数定义一个分数对象,下表列出了所有可能的值。所有分数对象都遵守的规则是:返回值越高越好。
用法例子:
从测度函数定义分数策略
sklearn.metrics
模块提供一套简单的函数,提供给定真实情况下的预测误差。
-
以
_score
编辑的函数,返回值越大越好。 -
以
_error
or_loss
编辑的函数,返回值越小越好。如果使用make_scorer
转换成一个分数对象,将参数greater_is_better
设为False.
一个典型的使用情况是,从具有非默认值参数的库里wrap一个存在的测度函数。例如,fbeta_score
函数的beta
参数。