机器学习简介
- 很好拟合训练数据但是做出错误预测叫做Bias-Variance Tradeoff。
- 交叉验证:(划分训练集和测试集)( 每个区域的数据都被用于测试过!)
- 交叉验证就是重复使用数据,把得到的样本数据进行切分,组合为不同的训练集和测试集,用训练集来训练模型,用测试集来评估模型预测的好坏。在此基础上可以得到多组不同的训练集和测试集,某次训练集中的某样本在下次可能成为测试集中的样本,即所谓的‘交叉’。
- example:将数据划分为四块,称为4折交叉验证。块的个数是随意的,通常是划分为十块,称为10折交叉验证。 - 混淆矩阵:TP = True Positive FP = False Positive TN=True Negative FN = False Negative
- 敏感性和特异性 Sensitivity & Specificity
S e n s i t i v i t y = T P ( T P + F N ) Sensitivity=\frac{TP}{(TP+FN)} Sensitivity=(TP+FN)TP
S p e c i f i c i t y = T N ( T N + F P ) Specificity =\frac{TN}{(TN+FP)} Specificity=(TN+FP)TN - 熵