通俗理解条件概率、条件期望、条件方差

文章详细解释了条件概率的推导性定义和一般定义,强调在给定条件下将其他因素视为背景。通过班级平均分的例子阐述了条件期望的概念,展示了如何计算不同群体的平均分,并指出总体期望是部分条件期望的期望。此外,还探讨了条件方差,将其分解为组内方差和组间方差,说明总的方差等于这两部分之和。
摘要由CSDN通过智能技术生成

写在前面:求“条件XX”时,对“条件”的理解可以是,把“XX条件”作为新的基本事件空间/总体看待,而忽略除这个条件以外的。类似于用摄像机照相时,一开始是整个画面,当得到“XX条件”的约束后,镜头聚焦,画面缩小至代表那个条件的小空间上。


一、条件概率

  1. 推导性定义

条件概率是通过样本点数目之比定义的,分子是事件“AB同时发生”的样本点数,分母是事件“A发生”的样本点数。然后上下同除以总的样本点数,再利用“频率的稳定值是概率”的知识,得到上下都是概率的除式。

2、一般定义

(注:)表示的是在随机事件A发生的条件下,随机事件B发生的概率。

理解

①分子:已知A发生,在此条件下B发生,也就是A、B同时发生了;

②分母:将条件“A发生”作为新的基本事件空间

二、条件期望与条件方差

此处举2个例子。

1、第一个例子

一个年级有两个班,分别是A班和B班,A班有3人,三人的分数分别为,B班有4人,四人的分数分别为。那么:

期望

①A班的班级平均分为,这是A班的条件期望 E(分数,班级=A班)。

②B班的班级平均分为,这是B班的条件期望 E(分数,班级=B班)。

③年级总的平均分为,这是总体的期望,此处体现了加权平均的思想。也对应一句话——总体的期望是部分条件期望的期望。

2、第二个例子

一个年级有r个班,记每个班的学生人数分别为、...、,把符号 定义为第i个班的第j名同学的成绩。那么:

这个年级的总人数为

期望

这个年级总的平均分为,表示将每位同学的成绩都加起来,再除以总人数。继续算下去,。即将分母的n纳进第一个求和号里,乘以,并再第二个求和号里除以。如此,第一个求和号表示每个班级人数占全年级人数的比例(加权平均的权),第二个求和号表示每个班级的平均分数。体现了——总体的期望是部分条件期望的期望。

方差

这个年级总的方差为,表示每个同学的成绩与总平均成绩的相减……继续算下去:,加一项减一项。将平方和展开,得到,将求和移到括号内,得到三个部分:(此处的分解与方差分析紧密相关,或者说如出一辙)

①第一部分:,表示每个班级的内部方差(组内方差);

②第二部分:,表示组间方差;

③第三部分:,因为与j无关,提到前面,即,只看后半部分,,因此第三部分等于0.

至此,说明总的方差=组内方差(部分条件方差的期望)+组间方差(部分条件期望的方差)


写在最后:本文是根据上课时老师的举例整理下来的,对课本上常见的公式定义没有过多涉及,只是希望通过例子帮助加深理解。如有错误,请告知,感谢。

  • 2
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: 自回归条件方差(Autoregressive Conditional Heteroscedasticity,ARCH)模型是一种用于描述时间序列波动率变化的模型。而对于ARCH模型的合理性检验,可以使用ARCH-LM检验(Lagrange Multiplier Test)。 使用R语言进行ARCH-LM检验的步骤如下: 1. 安装并加载“tseries”包。 ```{r} install.packages("tseries") # 安装 library(tseries) # 加载 ``` 2. 导入需要检验的时间序列数据。 ```{r} data <- read.csv("data.csv", header = TRUE) # 以csv格式导入数据 ``` 3. 进行ARCH模型拟合。 ```{r} fit <- arch(y = data[,1], power = 2, lags = 12, arch.model = TRUE) ``` 其中,y参数指定需要拟合的时间序列,power参数指定ARCH模型的阶数,lags参数指定最大滞后阶数,arch.model参数指定使用ARCH模型进行拟合。 4. 进行ARCH-LM检验。 ```{r} arch.test(fit$resid) ``` 其中,fit$resid指残差序列,arch.test()函数将进行ARCH-LM检验并输出检验结果。 如果ARCH-LM检验的p值小于显著性水平(例如0.05),则可以拒绝原假设,即认为存在自回归条件方差效应。反之,如果p值大于显著性水平,则接受原假设,即认为不存在自回归条件方差效应。 ### 回答2: 自回归条件方差(ARCH)检验是一种通过检测时间序列数据中的条件方差性来判断其自回归模型的适用性的方法。在R语言中,常用的包括tseries、rugarch等可以进行ARCH检验的工具包。 首先,我们需要加载所需的包并导入时间序列数据。假设我们的数据存储在一个名为"data"的数据框中,其中一列为我们要检验的时间序列。 ```R # 加载所需的包 library(tseries) library(rugarch) # 导入时间序列数据 data <- read.csv("data.csv") ``` 接下来,我们可以使用函数ARCHtest()来进行ARCH检验。ARCHtest()函数可以通过指定lag参数来控制ARCH模型的阶数。 ```R # 进行ARCH检验 arch_result <- ARCHtest(data$time_series, lag = 10) # 打印检验结果 print(arch_result) ``` 函数ARCHtest()返回一个包含检验结果的对象。我们可以使用print()函数来打印出检验结果。检验结果包括LM统计量、Lagrange乘子统计量、p值等。 需要注意的是,ARCHtest()函数只能对条件方差进行检验,即在满足自回归(AR)条件的前提下进行检验。如果时间序列数据不满足AR条件,可以先使用auto.arima()函数拟合AR模型,然后再进行ARCH检验。 以上是使用R语言实现自回归条件方差检验的简要步骤。根据数据的具体情况,可能需要进行参数调整或者添加其他的检验步骤。 ### 回答3: 自回归条件方差检验是一种用于判断时间序列数据中是否存在自回归条件方差的方法。在R语言中,可以使用rugarch包来实现自回归条件方差检验。 首先,我们需要安装rugarch包并加载它: ``` install.packages("rugarch") library(rugarch) ``` 接下来,我们需要准备好时间序列数据。假设我们有一个名为data的时间序列数据,我们可以使用以下代码创建一个rugarch.spec对象: ``` spec <- ugarchspec(variance.model = list(model = "sGARCH", garchOrder = c(1, 1)), mean.model = list(armaOrder = c(0, 0))) ``` 在这个spec对象中,我们指定了自回归条件方差模型为sGARCH模型,其中garchOrder参数为1,1,表示使用一阶GARCH模型。mean.model参数指定均值模型为ARMA模型,其中armaOrder参数为0,0,表示不使用自回归模型。 接下来,我们使用以下代码拟合参数并进行检验: ``` fit <- ugarchfit(spec, data) ``` 通过fit对象,我们可以获取模型的一些统计信息,如参数估计值、标准误差和对数似然等。 最后,我们可以使用以下代码进行异方差检验: ``` archTest(fit, lags = 10) ``` 其中lags参数指定检验的滞后阶数,这里设定为10。 以上就是使用R语言实现自回归条件方差检验的简要步骤。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值