切主题,咱们直接看定义。
Defination:
- 机器学习研究的是如何赋予计算机没有被明确编程的情况下仍能够学习的能力。(Samuel 1959)
- 如果一个计算机程序在任务集T中性能度量为p,且性能随着经验E提升,那么它可以说是从经验E中学习关于任务集T中的一些类以及性能度量P。(Mitchell)
- .机器必须以跟人类没有区别的方式来理解和响应。(Alan Turing)
特意找下英文看看恩达老师说的押韵感:
“A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P if its performance at tasks in T, as measured by P, improves with experience E.”
惭愧,我喜欢看书不喜欢听课,恩达老师的课程找时间吧。
basic terms:
混淆矩阵:
from sklearn.metrics import confusion_matrix
二分类情况下:
TP TN FN FP四种情况,很好记,T(true)开头都是分类对的,F(false)开头的都是分类错的;后面的比如TP,P是预测的结果,那立即推:该实例的实际情况是正例,其他类似。
准确率:
from sklearn.metrics import precision_score, recall_score
from sklearn.metrics import f1_score
from sklearn.metrics import precision_score
Accuracy(AC)=TP+TNTP+TN+FN+FP
Precision(P)=TPTP+FP
Recall(R,TruePositiveRate)=TPTP+FN
两者差别是:Precision的分母是FP,假玩意你给我当真的用了,Recall的分母是FN,真的宝贝你又给当假的了。
F−Measure=(β2+1)×P×Rβ2×P+R
β 取值范围是0到∞,可以看出F1-score结合了精确率P和回召并且参数化了得分。