分类模型的评估方法
内容包括常见二分类模型的分类效果评估方法,包括绝对指标、相对指标、通用指标,衍生到多分类模型的处理及验证,最后鸢尾花的三分类模型实例,附带有基于OVO和OVR的其他分类模型代码;
一、什么是分类模型?
分类模型是监督学习的一种,需要样本支撑进行模型构建,其输入可以是连续性也可以是离散型的变量,输出则是提前限定的离散分类标签,在实际使用中根据分类标签的种类可以分为二分类和多分类问题。
回归算法的策略函数多是均值方差最小,分类算法的策略函数比较多样,有纯线性代数层面的均值方差最小,也有纯概率层面的优化函数,回归函模型目的是得到最优的拟合曲线,回归算法则是得到一个决策面实现对数据的最大程度划分,其输出是系列离散值,在通常建模过程中也可以将问题归结于回归问题后使用映射函数转换成分类问题(比如逻辑回归的sigmod函数);
常见的分类算法包括:逻辑回归、决策树、向量机、贝叶斯、K最近邻、神经网络、复合算法中RF、LGB、GBDT与XGboost也有相应分类算法;