统计学习-机器学习方法概论

统计学习-机器学习方法概论

  1. 机器学习的对象是:具有一定的统计规律的数据。
  2. 机器学习根据任务类型,可以划分为:
    监督学习任务:从已标记的训练数据来训练模型。 主要分为:分类任务、回归任务、序列标注任务。
    无监督学习任务:从未标记的训练数据来训练模型。主要分为:聚类任务、降维任务。
    半监督学习任务:用大量的未标记训练数据和少量的已标记数据来训练模型。
    强化学习任务:从系统与环境的大量交互知识中训练模型。
  3. 机器学习根据算法类型,可以划分为:
    传统统计学习:基于数学模型的机器学习方法。包括SVM、逻辑回归、决策树等。
    这一类算法基于严格的数学推理,具有可解释性强、运行速度快、可应用于小规模数据集的特点。
    深度学习:基于神经网络的机器学习方法。包括前馈神经网络、卷积神经网络、递归神经网络等。
    这一类算法基于神经网络,可解释性较差,强烈依赖于数据集规模。但是这类算法在语音、视觉、自然语言等领域非常成功。
  4. 没有免费的午餐定理(No Free Lunch Theorem:NFL):对于一个学习算法A,如果在某些问题上它比算法B好,那么必然存在另一些问题,在那些问题中B比A更好。因此不存在这样的算法:它在所有的问题上都取得最佳的性能。因此要谈论算法的优劣必须基于具体的学习问题。

一、基本概念


1. 1特征空间
1.输入空间 :所有输入的可能取值;输出空间 :所有输出的可能取值。特征向量表示每个具体的输入, 所有特征向量构成特征空间。
2.特征空间的每一个维度对应一种特征。
3.可以将输入空间等同于特征空间,但是也可以不同。绝大多数情况下,输入空间等于特征空间。模型是定义在特征空间上的。

1. 2样本表示

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值