第三章 线性模型

对于线性模型的理解:
    线性模型试图学得一个通过属性的线性组合来预测的函数,本章主要介绍了三种线性模型:
    回归任务的线性模型、二分类任务的线性模型、多分类任务的线性模型。
1、回归任务的线性模型
    (1)对于输入属性数目只有一个的
        基于均方误差最小化的最小二乘法来求解,即找到一条直线,使得所有样本到直线上的
        欧式距离之和最小。即求的这条直线的W,b 的最优解。
    (2)对于输入属性数目有多个的
2、二分类任务的线性模型
        同样用最小二乘法对W和b进行估计,把数据集表示为一个m x (d+1)大小的矩阵X。
        LDA(线性判别分析):设法将指定的训练集投影到一条直线上,使得同类样例尽可能的
                        近,异类样例尽可能的远离,在对新鲜样本进行分类时将其同样的这条直线
                        上,再根据投影点的位置来确定新样本的类别。
3、多分类任务的线性模型
    采用拆解法,即将多个任务拆解为若干个二分类任务求解;
    主要介绍了三种方法:OvO(一对一)、OvR(一对其余)、MvM(多对多)
    (1)OvO(一对一):
        将N个类别两两配对,产生N(N-1)/2个二分类任务,然后在测试时将新样本同时提交给
        所有分类器得到N(N-1)/2个结果,最后把预测得到最多的类别作为最终分类结果。
    (2)OvR(一对其余):
        每次将一个类的样例作为正例、所有其他样例作为反例来训练N个分类器,测试时若得到的预测结果
        只有一个分类器是正类,其余都是反类,则该正类作为分类结果,若有多个正类则将各分类器中置信度最大的
        分类器作为分类结果。
    (3)MvM(多对多):
        每次将若干个类作为正类,若干个其他类作为反类
        常用的技术:
            纠错输出码(ECOC):
                编码:对N个类进行M次划分,每次划分一部分正类一部分反类,从而形成M个二分类训练集
                训练出M个分类器。
                解码:分类器对预测样本进行预测,预测标记组成一个编码,将这个预测编码与每个类别各自的
                编码进行比较,返回其中距离最小的类别作为最终预测结果。
    

未完待续。。。。。。。。。。。。。。。。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值