独立同分布(Independent and Identically Distributed,简称i.i.d.)是概率论中的一个重要概念。它描述的是一系列随机变量之间的两个基本性质:
独立性:这意味着每一个随机变量的取值不会受到其他随机变量取值的影响。换句话说,一个随机变量的取值不会“告诉”你关于其他随机变量取值的任何信息。
同分布:这意味着所有随机变量都遵循相同的概率分布。也就是说,它们有相同的概率密度函数(对于连续型随机变量)或概率质量函数(对于离散型随机变量)。
在实际应用中,独立同分布假设经常用于简化问题或模型。例如,在机器学习中,训练数据通常被假设为独立同分布,这意味着每个训练样本都是独立地从相同的分布中抽取出来的。这个假设有助于我们构建和训练模型,但需要注意的是,在实际情况中,这个假设可能并不总是成立。
在Python中,我们可以使用NumPy等库来生成独立同分布的随机变量。例如,下面的代码生成了1000个独立同分布的正态随机变量:
python
import numpy as np
设置随机种子以便结果可复现
np.random.seed(0)
生成1000个独立同分布的正态随机变量,均值为0,标准差为1
iid_samples = np.random.normal(loc=0, scale=1, size=1000)
在这个例子中,np.random.normal函数用于生成正态分布的随机变量,loc参数指定均值,scale参数指定标准差,size参数指定生成的随机变量的数量。由于我们没有指定任何依赖关系或不同的分布参数,所以生成的随机变量是独立同分布的。