2.评估指标(evaluation metrics)
(1)机器学习研究的是,如何根据数据进行预测。
(2)务必要将数据分为训练集以及测试集,目的是对得到独立的数据集并以此对模型进行良好的泛化。
(3)针对不同的模型,选择相关的指标,完成对模型的评估。之后将介绍常见的模型误差来源,以及如何正确分解数据集
3.分类和回归
(1)分类指,根据未见过的样本进行预测,并对未知的实例进行分类,离散数据,给定类别。
(2)回归指,根据连续的数据进行预测
(3)问题决定着如何评估模型
4.
分类指标:多久模型进行一次准确或者不准确的预测
准确率:正确标识的点/所有的点,不适用于大数量数据集中,仅有少量想要的数据时,以及需要准确预测结果时。
精确率:
召回率:特定类,
F分数:
回归指标:预测值与实际值的差如何
平均绝对误差:
均方误差:
9.混淆矩阵(confusion metrics)
24.F1分数为精确率和召回率的加权平均值:
(精确率*召回率)/(精确率+召回率)*2(0-1,越大越好)
sklearn.metrics.
f1_score
(y_true, y_pred