漫步数理统计一——绪论

许多调查可以由部分进行表征,前提是基于以下事实:在基本相同的条件下,重复进行的试验或多或少是标准的程序。 例如,在医学研究中关注点集中于待使用药物的效果;或对经济学家而言,关注的可能是三种指定商品在不同时间的价格;或对农艺师而言,可能想研究化肥对谷物产量的影响。调查人员获得此类信息的唯一方法就是进行实验。每个实验都会产生一个结果,但这些试验的特点是在实验进行之前我们无法进行预测。

假设我们有这样一个试验,其结果不能确定的预测出来,但在执行之前,每个可能结果能被准确的描述出来,如果这种试验可以在相同条件下重复进行,我们就被它为随机试验,并且每个可能结果的集合称为试验空间或样本空间。

1 现在投掷一枚硬币,背面朝上用T表示,正面朝上用 H 表示,假设在相同的条件下硬币可以重复投掷,那么这个硬币的投掷过程就是一个随机试验的例子,在这个试验中结果就是两个符号T,H中的一个;即样本空间是这两个符号的集合。

2 现在红白两方每人掷一次骰子,结果用有序数对表示,假设在相同的条件下双方重复掷骰子,那么产生数对过程就是一个随机试验,样本空间有36个有序对组成: (1,1),,(1,6),(2,1),,(2,6),,(6,6)

C 表示样本空间, c 表示C中的一个元素, C 表示C中元素的一个集合,如果试验的结果在 C 中,我们就说事件C发生了。现在设想我们进行了 N 次随机试验,那么我们可以得出N个结果中 C 发生的次数(频数)f,比率 f/N 称为 N 次试验中事件C的相对频率,当 N 很小时相对频率通常不稳定,从掷硬币中就能感觉出来。但是随着N的增大,经验表明我们可以将事件 C 与一个数联系起来,假设为p,它等于或近似等于相对频率稳定的那个数。如果这么做的话,那么 p 可以看成未来试验中,事件C相对频率要么等于要么近似等于的值,因此,虽然我们不能预测随机试验的结果,但是当 N 非常大时,我们预测C发生的相对频率。与事件 C 关联的数p有许多名字,有时称为试验结果在 C 中的概率;有时称为事件C的概率;有时称为 C 的概率测度,通常会根据上下文选择合适的属于。

3 C 表示例2的样本空间, C C中满足和等于7的有序对组合的集合,那么 C 就是(1,6),(2,5),(3,4),(4,3),(5,2),(6,1)。假设骰子掷了 N=400 次,和等于7的频数 f=60 ,那么结果在 C 中的相对频数是f/N=60400=0.15,因此我们可以将 C 与非常靠近0.15的数p联系起来, p 称为事件C的概率。

1 上面概率的解释有时看成相对频率法,它显然依赖这样的事实:试验在基本相同的条件下重复进行。然而,许多人将其看成合理的置信度量,据此将概率应用到其他情况。例如 p=25 意味着对于事件 C 而言,他们个人的或主观的概率等于25,因此,如果他们愿意赌博的话,这可以解释成他们对结果 C 下注的意愿,这样的话两种结果的比率为p/(1p)=25/35=23,并且,如果他们确实相信 p=25 是正确的,那么他们更愿意下注到另一方: (a) 如果 C 发生就赢3元,不发生的话输2 元,或者(b)如果 C <script type="math/tex" id="MathJax-Element-57">C</script>不发生赢2元,不发生的话输3元。然而,因为概率的数学性质与这两种解释都是一致的,所以数学的发展并不依赖于使用哪种方法。

掌握统计数学理论的主要目的是提供随机试验的数学模型,一旦提供了这种试验的模型并且详细阐述了理论,那么统计学家就可以在这个框架内对随机试验进行推断(即得出结论)。 这种模型的构建需要概率论,逻辑上满足概率的一个模型就是基于集合概念和集合函数的模型,下篇博文简单介绍一下集合论的相关知识。

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值