多元分类和过拟合

一、多元分类

1. one-vs-all:选择得分最高的类别

有几个类别建立几个分类器,单个分类器只识别一个类别。

classifierAclassifierBclassifierCclassifierD
positive0.560.960.220.11
negtive0.440.040.780.89

上面表格对应的样例的分类结果为class B。

2. one-vs-one:

设有n个类别,则会针对两两类别建立二项分类器,得到k=n*(n-1)/2个分类器。对新数据进行分类时,依次使用这k个分类器进行分类,每次分类相当于一次投票,分类结果是哪个就相当于对哪个类投了一票。在使用全部k个分类器进行分类后,相当于进行了k次投票,选择得票最多的那个类作为最终分类结果​。

二、欠拟合和过拟合

1. 欠拟合:模型模拟有很大的偏差(bias)

2. 过拟合:模型完全符合训练数据,但在新的数据上表现不佳

过拟合的解决方法:

  • 减少变量数量,需要筛选特征变量,舍弃变量意味着信息丢失。(人为选择或者模型选择)
  • 正则化,保留所有变量。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值