统计学习——一. 统计学习方法概论

1. 统计学习简介

1.1 定义

统计学习是计算机基于数据构建概率统计模型并运用模型对数据进行分析与预测的一门学科。

1.2 对象

data:计算机及互联网上的各种数字、文字、图像、视频、音频数据以及它们的组合。

1.3 目的

用于对数据(特别是未知数据)进行预测和分析。

2. 统计学习的方法

统计学习方法分类:

  • 监督学习(Supervised learning)
  • 无监督学习(Unsupervised learning)
  • 半监督学习(Semi-supervised learning)
  • 强化学习(Reinforcement learning)

2.1 监督学习

  • 训练数据 training data
  • 模型 model / 假设空间 hypothesis
  • 评价准则 evaluation criterion / 策略 strategy
  • 算法 algorithm
联合概率分布
  • 假设输入与输出的随机变量X和Y遵循联合概率分布P(X,Y)
  • P(X,Y)为分布函数或分布密度函数
  • 对于学习系统来说,联合概率分布是未知的
  • 训练数据和测试数据被看作是依联合概率分布P(X,Y)独立同分布产生的
假设空间
  • 监督学习目的是学习一个由输入到输出的映射,称为模型
  • 模式的集合就是假设空间(hypothesis space)
  • 概率模型:条件概率分布P(Y|X), 决策函数:Y=f(X)

2.2 无监督学习

  • 训练集:U = {x1,x2,……,xN}
  • 模型函数:z = g(x)
  • 条件概率分布:P(z|x)
    在这里插入图片描述

2.3 强化学习

强化学习定义

强化学习的马尔可夫决策过程是状态、奖励、动作序列上的随机过程,由五元组<S,A,P,r,γ>组成。

  • S是有限状态(state)的集合
  • A是有限动作(action)的集合
  • P是状态转移概率(transition probability)函数:P(s’|s,a)=P(st+1=s,at=a)
  • r是奖励函数(reward function):r(s,a) = E(rt+1|st=s,at=a)
  • γ是衰减系数(discount factor):γ位于区间[0,1]
    在这里插入图片描述
强化学习概念
  • 策略:给定状态下动作的函数a=f(s)或者条件概率分布P(a|s)
  • 价值函数
    • 状态价值函数
      在这里插入图片描述

    • 动作价值函数
      在这里插入图片描述

强化学习方法
无模型(model-free)
  • 基于策略(policy-based):求解最优策略π*
  • 基于价值(value-based):求解最优价值函数
有模型(model-based)
  • 通过学习马尔可夫决策过程的模型,包括转移概率函数和奖励函数
  • 通过模型对环境的反馈进行预测
  • 求解价值函数最大的策略π*

2.4 半监督学习

  • 少量标注数据,大量未标注数据
  • 利用未标注数据的信息,辅助标注数据,进行监督学习
  • 较低成本

3. 统计学习三要素

方法 = 模型 + 策略 + 算法

3.1 模型

在这里插入图片描述

3.2 策略

求最优模型就是求解最优化问题:

  • 损失函数:一次预测的好坏

    • 0-1损失函数
      在这里插入图片描述

    • 平方损失函数
      在这里插入图片描述

    • 绝对损失函数
      在这里插入图片描述

  • 风险函数:平均意义下模型预测的好坏

3.3 算法

  • 如果最优化问题有显式的解析式,算法比较简单
  • 但通常解析式不存在,就需要数值计算的方法
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
毕设新项目-基于Java开发的智慧养老院信息管理系统源码+数据库(含vue前端源码).zip 【备注】 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用!有问题请及时沟通交流。 2、适用人群:计算机相关专业(如计科、信息安全、数据科学与大数据技术、人工智能、通信、物联网、自动化、电子信息等)在校学生、专业老师或者企业员工下载使用。 3、用途:项目具有较高的学习借鉴价值,不仅适用于小白学习入门进阶。也可作为毕设项目、课程设计、大作业、初期项目立项演示等。 4、如果基础还行,或热爱钻研,亦可在此项目代码基础上进行修改添加,实现其他不同功能。 欢迎下载!欢迎交流学习!不清楚的可以私信问我! 毕设新项目-基于Java开发的智慧养老院信息管理系统源码+数据库(含vue前端源码).zip毕设新项目-基于Java开发的智慧养老院信息管理系统源码+数据库(含vue前端源码).zip毕设新项目-基于Java开发的智慧养老院信息管理系统源码+数据库(含vue前端源码).zip毕设新项目-基于Java开发的智慧养老院信息管理系统源码+数据库(含vue前端源码).zip毕设新项目-基于Java开发的智慧养老院信息管理系统源码+数据库(含vue前端源码).zip毕设新项目-基于Java开发的智慧养老院信息管理系统源码+数据库(含vue前端源码).zip毕设新项目-基于Java开发的智慧养老院信息管理系统源码+数据库(含vue前端源码).zip毕设新项目-基于Java开发的智慧养老院信息管理系统源码+数据库(含vue前端源码).zip毕设新项目-基于Java开发的智慧养老院信息管理系统源码+数据库(含vue前端源码).zip
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值