前言
花费一整天定制OSpider_ExtraTools,又用大半天处理GIS保研讲座的备课,笔记电子化的时间稍微晚了一些。不得不说,坚持做笔记确实不是一件容易的事情。
章节二 机器学习通用方法
课时7 机器学习性能度量方法
虽然老师讲性能度量和模型评估不一样,但是在我看来是高度近似的。**这里可能存在理解问题
课程主要讲的是监督学习的问题,包括回归和分类两大类。一个思维导图给出了分类和回归类机器学习模型性能的常用度量指标:
回归的几个指标都很Easy,相对难算一点的就是R方和调整R方了,但这是统计学的相关内容,这里就不说了。重点看分类的几个指标(我原来虽然知道,但是有点糊):
一个核心概念是分类的混淆矩阵,如下图所示。(Markdown不支持复杂表格,复杂表格要么用嵌入式的Html来做,要么直接用图片代替把)
所谓Positive,在0-1分类中无疑就是指1;在多分类问题中,我认为是指我们关注的类。一个机器学习模型可以识别图片中是否有人,那么“有人”-1就是我们关注的Positive;另一个机器学习模型用于识别图片中是否有男人或女人(让我们忽略中性)ÿ