监督学习中假设输入与输出的随机变量X和Y遵循联合概率分布P(X,Y)的一种理解

联合概率分布的定义

  • 联合概率是指在多元的概率分布中多个随机变量分别满足各自条件的概率。假设X和Y都服从正态分布,那么P{X<4,Y<0}就是一个联合概率,表示X<4,Y<0两个条件同时成立的概率。表示两个事件共同发生的概率。A与B的联合概率表示为 P(AB) 或者P(A,B),或者P(A∩B)。(参考百度百科

参数定义

  • X X X : 输入随机变量
  • Y Y Y : 输出随机变量
  • X i X_{i} Xi : 随机变量 X X X的一个具体取值
  • Y i Y_{i} Yi : 随机变量 Y Y Y的一个具体取值
  • I n p u t Input Input : 输入空间(特征空间)
  • O u t p u t Output Output :输出空间

问题描述

监督学习中假设输入与输出的随机变量 X 和 Y X和Y XY遵循联合概率分布 P ( X , Y ) P(X,Y) P(X,Y)

一种理解思路

  • 对任意一个输入空间的随机变量 X i X_{i} Xi通常对应这输出空间的一个随机变量 Y i Y_{i} Yi;也就是说 ( X i , Y i ) (X_{i},Y_{i}) (Xi,Yi)是成对出现的。
  • 所以设集合 Ω = { ( X i , Y i ) ∣ X i ∈ I n p u t ; Y i ∈ O u t p u t ; i = 1... n } \Omega=\{(X_{i},Y_{i})|X_{i}\in Input ; Y_{i} \in Output; i = 1 ...n\} Ω={(Xi,Yi)XiInput;YiOutput;i=1...n};
  • Ω \Omega Ω可以为有限集也可以为无穷集;在实际生活中, Ω \Omega Ω通常是无穷集或者更准确的说是不完全可测集,也就是说这个集合通常不能获得所有元素 ( X i , Y i ) (X_{i},Y_{i}) (Xi,Yi)的观测值,一般我们只能获得其中的一小部分元素的观测值。我们要清楚,我们是使用少量的训练数据来构建模型,然后用该模型去预测那些我们不知道观测值的元素,因此如果我们已经知道 Ω \Omega Ω所有元素的观测值,那么我们就没有预测的必要了。
  • S t r a i n , S t e s t , S o t h e r S_{train},S_{test},S_{other} Strain,Stest,Sother分别为训练集、测试集、 Ω \Omega Ω中除去 S t r a i n , S t e s t S_{train},S_{test} Strain,Stest剩余元素的集合。
  • 上面三个集合的并集就是 Ω \Omega Ω
  • 对于三个集合中的任何一个元素或者说 Ω \Omega Ω空间中的一个点都对应着一个概率值,并且这个概率值只与这个点本身有关,所以只要是空间中的一个点,就对应着一个 ( X i , Y i ) (X_{i},Y_{i}) (Xi,Yi)并且对应着一个概率 P ( X i , Y i ) P(X_{i},Y_{i}) P(Xi,Yi)表示这个点( X i , Y i X_{i},Y_{i} Xi,Yi)出现的概率。
  • 所以简单的说就是, X i X_{i} Xi总是以 P ( X i , Y i ) P(X_{i},Y_{i}) P(Xi,Yi)的概率与 Y i Y_{i} Yi同时出现

其他的一些补充

  • S t r a i n , S t e s t S_{train},S_{test} Strain,Stest是在 Ω \Omega Ω空间中的随机取样,应满足独立同分布。否则构建出的模型是无意义的。也就是说只有独立同分不布的训练集和测试集才能最接近的模拟处整个 Ω \Omega Ω空间的分布。
  • 我们使用模型对未知数据(只知道X的值但是不知道Y的值)进行预测时,输出的点 ( X i , Y i ′ ) (X_{i},Y^{'}_{i}) (Xi,Yi)在模型正确的条件下不一定属于 Ω \Omega Ω但其 Ω \Omega Ω的距离是非常近的。
  • 8
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值