机器学习
评估方法
错误率(error rate)
:m个样本中有a个样本分类错误, E R R = a m ERR=\frac{a}{m} ERR=ma。精度(accuracy)
:分类正确的样本数
占总样本数的比例, A C C = 1 − E R R ACC=1-ERR ACC=1−ERR。误差(error)
:学习器的实际预测输出与样本的真实输出之间的差异。训练误差(training error)
:训练集上的误差。泛化/测试误差(generalization/testing error)
:新样本\测试集上的误差;用测试误差可近似泛化误差。过拟合(overfitting)
:,训练误差低,泛化误差高;反之则欠拟合(underfitting)
。- 将一个数据集划分为训练集和测试集(
应保证数据集与子集的数据分布一