《统计学习方法》--李航

本文深入探讨了统计学习方法,重点关注监督学习,包括模型、策略和算法。解释了监督学习中模型的选择,如正则化和交叉验证,以及生成模型与判别模型的差异。同时,提到了一些经典算法,如感知机、决策树、朴素贝叶斯和支持向量机,强调了它们在处理不同类型问题中的适用性和优缺点。
摘要由CSDN通过智能技术生成

机器学习简述

统计学习

知乎详细
是什么:是关于计算机基于数据构建概率统计模型并运 用模型对数据进行预测与分析的一门学科.统计学习也称为统计机器学习。
对象:是数据(data).它从数据出发,提取数据的特征,抽象出数据的模型,发现数据中的知识,又回到对数据的分析与预测中去.数据是多样的。
数据的基本假设:同类数据具有一定的统计规律性。
目的:对数据进行预测与分析,特别是对未知新数据进行预测与分析.对数据的预测可以使计算机更加智能化,或者说使计算机的某些性能得到提高;对数据的分析可以让人们获取新的知识,给人们带来新的发现.
方法:是基于数据构建统计模型从而对数据进行预测与分析,统计学习由监督学习(supervised learning)、非监督学习(unsupervised learning)、半监督学习(semi-supervised learning)和强化学习(reinforcement learning)

监督学习

监督模型:监督学习(supervised learning)的任务是学习一个模型,使模型能够对任意
给定的输入,对其相应的输出做出一个好的预测。
输入空间,特征空间,输出空间:输入远小于输出,有限元素的集合。
特征空间:特征向量的空间
问题特征:回归问题:输入输出都为连续,分类问题:输出为离散变量,标注问题:输入,输出都为变量序列。
假设:输入与输出遵循联合概率分布函数,

统计学习的三要素:模型(model)、策略(strategy)和算法(algorithm).
从给定的、有限的、用于学习的训练数据(training data)集合出发,假设数据是独立同分布产生的;并且假设要学习的模型属于某个函数的集合,称为假设空间(hypothesis space);应用某个评价准则(evaluation criterion),从假设空间中选取一个最优的模型,使它对已知训练数据及未知测试数据(test data)在给定的评价准则下有最优的预测;最优模型的选取由算法实现.<

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值