`sklearn.metrics` 是 scikit-learn 库中的一个模块,它提供了许多用于评估预测模型性能的指标和工具。这些指标和工具可以帮助你了解模型在训练集和测试集上的表现,以及模型是否能够很好地泛化到未见过的数据。
以下是一些 `sklearn.metrics` 中常用的函数和指标:
1. **分类指标**:
- `accuracy_score`: 计算分类准确率。
- `classification_report`: 显示主要分类指标的文本报告,包括精确度、召回率、F1 分数等。
- `confusion_matrix`: 计算混淆矩阵,用于评估分类模型的性能。
- `precision_score`: 计算精确度。
- `recall_score`: 计算召回率。
- `f1_score`: 计算 F1 分数(精确度和召回率的调和平均数)。
- `roc_auc_score`: 计算接收者操作特性(ROC)曲线下的面积(AUC)。
2. **回归指标**:
- `mean_squared_error`: 计算均方误差(MSE)。
- `mean_absolute_error`: 计算平均绝对误差(MAE)。
- `r2_score`: 计算 R² 分数,即决定系数。
3. **聚类指标**:
- `silhouette_score`: 计算轮廓系数,用于评估聚类效果。
- `calinski_harabasz_score`: 计算 Calinski-Harabasz 指数,用于评估聚类效果。 - `davies_bouldin_score`: 计算 Davies-Bouldin 指数,用于评估聚类效果。
4. **配对指标**:
- `pairwise_distances`: 计算数据集中每对样本之间的距离
- `pairwise_kernels`: 计算样本对之间的内核相似度。
5. **其他**:
- `make_scorer`: 创建一个自定义的评分函数。
- `check_consistent_length`: 检查多个数组是否具有一致的长度
使用 `sklearn.metrics` 中的函数时,通常需要将真实标签(`y_true`)和模型预测的标签(`y_pred`)作为参数传入。这些函数会返回相应的评估指标值,帮助你了解模型的性能。