女士品茶

第七章 费歇尔获胜

费歇尔在英国皇家统计学会会议上宣读了他的论文《归纳推理的逻辑》。
高尔顿生物统计实验室成长为生物统计学系。他退休后,该系一分为二,费歇尔受命担任其中之一的优生学系的系主任,另一个则是规模缩小了的生物统计学系,系主任由 K·皮尔逊的儿子 E·皮尔逊担任。

费歇尔学派与皮尔逊学派:两种统计观

K·皮尔逊把统计分布视为对他所分析数据的集合的真实描述。而按照费歇尔的观点,真实分布只是一个抽象的数学公式,搜集的数据只能用来估计这个真实分布的参数。既然所有的估计都有误差,那么费歇尔提出来的一些分析的手段,可以把这种误差的程度降到最低,或者可以更经常地得出比其他任何手段都更接近真实分布的答案。
K·皮尔逊把测量值的分布视为一个真实的存在。在他的方法里,对于一个给定的情况,有一个庞大的然而却是有限的(finite)测量值的集合。在理想情况下,科学家会搜集所有的这些测量值,并确定其分布参数。如果无法搜集到全部测量值,那么就搜集一个很大的并且具有代表性的数据子集(subset)。 由这些大量的、且具代表性的子集计算出来的参数会与完备集合的参数相同;此外,那些用来计算完备集合参数值的数学方法也适用于有代表性的子集的参数估计,而不会有严重的误差。
但依照费歇尔的观点,测量值是从所有可能出现的测量值中随机选取的,依据随机选取的数据计算得出的一个参数的任何估计值,其结果本身也具有随机性,因此,也会服从一种概率分布。为了能清楚地区分参数的估计值与参数本身这两个不同的概念,费歇尔把这个估计值称为“统计量”(statistic); 不过现代术语往往称其为“估计量”(estimator)。假设我们有两种不同的方法可以得到一个统计量,以估计某个特定的参数。
:例如老师想了解一个学生对知识掌握到什么程度(参数), 就在全班进行了几次测验(测量), 并且计算出测验的平均分数(统计量)。 那么,究竟是用中位数(median)作统计量“更好”呢,或是取这几次测验中的最高分与最低分的平均值“更好”呢,还是去年最高分与最低分然后把其余的测验成绩加以平均“更好”?
既然统计量是随机的,那么讨论这个统计量的某个值的准确性到底有多大是毫无意义的。我们需要的是一个判别的准则,这个准则以统计量的概率分布为依据,就像 K·皮尔逊所指出的那样,对一组测量进行估计,必须根据它们的概率分布,而不是根据个别观测值。评判哪一个是好的统计量,费歇尔提出了如下三个准则:
一致性(consistency): 得到的数据越多,计算出来的统计量接近参数真值的概率就越大;
无偏性(unbiasedness):如果用很多组不同数据集多次测量某一特定的统计量,那么该统计量的这些测量值的平均数应该近似于这个参数的真值;
有效性(efficiency): 统计量的值不会完全等于该参数的真值,但是用来估计一个参数的大多数统计量应该与真值相去不远。

应该把统计量本身视为随机的,而好的统计量一定有好的概率特性。对于某一特定数据集,我们永远不知道一个统计量的值是否正确,只能说我们用一种方法得出来一个符合这些准则的统计量。

事实上,一些有偏的统计量的应用常常极为有效。

费歇尔的极大似然法

为了得到一致且有效(但未必无偏)的统计量,费歇尔提出了被他称之为“极大似然估计量”(maximum likelihood estimator, MLE)的一个概念。
随后,费歇尔证明了 MLE 总是一致的,而且证明了如果人们认可几个被认为是“正则性条件”(regularity conditions)的假定,那么 MLE 是所有统计量中最有效的。此外,费歇尔还证明了,即便 MLE 是有偏的,也可以计算出其偏差的大小,然后将其从 MLE 的估计值中减掉,从而得到一个一致、有效且无偏的修正统计量。(后人指出,就算费歇尔的正则性条件不成立,仍然有可能由 MLE 构造出一个最有效的统计量。)
电脑用迭代算法可以算出MLE值。

迭代算法

迭代:试位法的思想:
你先猜一个答案,并把它代入问题中,由此你会得到一个结果,而它和你想要的结果之间会有些差异。有了这个差异,接着你可以用它再产生一个更好的猜测,再用这个新的猜测得到一个新的差异,这个差异又会产生出另一个新的猜测值。如果在计算这个差异的过程中,你做得足够聪明,这一连串的猜测值会最终接近正确的答案。

EM算法、模拟退火法、克利金法(kriging)、“大都会”(Metropolis)算法、“侯爵”(Marquardt)算法。

第八章 致死的剂量

由作者参加的一次生物统计学会的春季会议,引出切斯特·布利斯(Chester Bliss),并讲述了布利斯的故事。
布利斯,美国人,大学学昆虫学。在美国农业部参与研制杀虫剂。因为在田间试验杀虫剂会受到许多无法控制变量的干扰,使结果难以解释,于是,他把昆虫带到实验室里,做了一系列的实验。

概率单位分析

他把昆虫分成几组,养在广口玻璃瓶里,然后用不同成分和不同剂量的杀虫剂来实验。在他做这些实验的过程中,发现了一个值得关注的现象:无论他配制的杀虫剂尝试有多高,在用药之后总会有一两只昆虫还活着;此外,无论他怎么稀释杀虫剂,即便只是用了装过杀虫剂的容器,试验结果也总会有几只昆虫死掉。
布利斯发明了一种他称之为“概率单位分析”(probit analysis)的方法。建立了“杀虫剂的剂量”与“使用该剂量时一只虫子会死掉的概率”这两者间的关系。他的模型中生成的最重要的参数谓之“半数致死剂量”(50 percent lethal does), 通常用“LD-50”来表示,是指杀虫剂能以 50%的概率杀死虫子的剂量。或者说,如果施用这种杀虫剂来对付大量的虫子,那么用“LD-50”的剂量,将有 50%的虫子被杀死。布利斯模型的另一个推论则是:对一只特定的用做实验标本的虫子,要确定杀死它所需要的剂量是不可能的。
例:吸毒。吸毒者看到其他人同样服用这些毒品却没有死于中毒。但即使知道某些个体还活着,也无法确定一个给定个体能否幸免于一死。我们根本没有任何办法能够预见某一独特个体对药物剂量的反应。
我们完全可以运用概率单位分析或选择其他模型来分别估计一个不同的致死剂量,如“LD-25”或“LD-80”(25%的死亡剂量,或 80%的死亡剂量)。 不过,离 50%点越远,就越需要更大规模的实验才能得到理想的估计值。(why?)

布利斯在列宁格勒

书中又讲了布利斯的一些经历:在经济萧条罗斯福新政期间被解雇——去英国与费歇尔一起完善概率单位分析的方法论——去苏联的列宁格勒植物研究所——被怀疑为间谍后被调查——继续研究工作——因政治局势离开苏联

第九章 钟形曲线

欧洲的数学家正在研究与统计建模有关的理论问题——中心极限定理

什么是中心极限定理

大量数据集合的平均数都有一个统计分布,而中心极限定理则阐明, 无论初始数据是怎么来的,这个分布都可以用正态概率分布来逼近。 这个正态概率分布与拉普拉斯的误差函数(Laplace’s error function)相同,有时也叫做高斯分布(Gaussian distribution), 而在浅显通俗的普及书里,也常被称为“钟形曲线”(bell-shaped curve)。 在 18 世纪晚期,亚伯拉罕·棣莫弗(Abraham de Moivre)已经证明,由机会博弈(games of chance)所得数字的简单集合符合中心极限定理。然而,在此之后的 150 年里,对这个猜想的证明没有丝毫的深入进展。
用正态分布来描述大部分数据都是正确有效的,因此,中心极限定理普遍被认为是一个正确的猜想。一旦假定数据服从正态分布,数学上的处理就容易多了。正态分布具备某些非常优良的性质:如果有两个随机变量服从正态分布,那么两变量之和也同样服从正态分布。就一般而言,正态变量的各种类型的和与差也都服从正态分布。因此,由正态随机变量(variate)推演得出的许多统计量,其自身也服从正态分布。
由于正态分布在数学上的计算处理非常敏捷,因此在建模时,统计学家常常要假定所有的数据都服从正态分布。不过,做这样的假定就不能不援引中心极限定理。
中心极限定理是否成立?说得更准确一点,它在什么条件下成立?

“死亡万岁!”

西班牙的法西斯主义者——长枪党占领了沙拉曼卡大学,大学校长遭到软禁,一个月后死亡。长枪党的M.A将军的座右铭是“死亡万岁!”
苏联的大清洗运动切断俄国数学家与欧洲其他地方的联系;希特勒的种族政策几乎毁掉了德国的大学,因为欧洲许多伟大的数学家要么是犹太人,要么是与犹太人联姻,而非犹太裔的那些数学家又大多是反纳粹的。
芬兰的亚尔·瓦尔德马·林德伯格和法国的保罗·利维分别发现了能够使中心极限定理这个猜想成立所必需的一组重叠的条件。这证明了至少存在三种解这个问题的方法,而且证明了中心极限定理不是只有一个单个的定理,而是有一组定理,其中每个中心极限定理都能从略有区别的一组条件中推导出来。到了 1934 年,中心极限定理(组)终于不再是猜想了,一个科学家必须要做的只是要证明林德伯格·利维条件(Lindeberg-LévyConditions)成立,那么中心极限定理就成立,于是,他就可以随意地把正态分布设为一个合适的模型。

林德伯格·利维条件与 U统计量

然而,就一个特定情况而言,要证明林德伯格·利维条件成立很难。
1948年,霍夫丁在《数理统计年报》(Annals of Mathematical Statistics)上发表了一篇论文,题目是“渐近正态分布的一组统计量”。
回顾:费歇尔曾把**统计量(statistic)**定义为:从观察到的测量值得出的、可用来估计其分布参数的一个数值。
费歇尔还建立了有用的统计量应该具备的一些准则,在这个过程中,
他还指出了利用皮尔逊的许多方法导出的统计量不符合这些准则。有很多种计算统计量的不同方法,其中的很多统计量都能满足费歇尔提出的准则。一旦计算出统计量,为了要用它,我们必须知道它的分布。如果它服从正态分布,用起来就容易多了。
霍夫丁提出了一种他所谓的“U-统计量(U-statistics)”, 并指出一个统计量如果属于这种 U-统计量,则满足林德伯格·利维条件。

霍夫丁在柏林

霍夫丁在柏林读数学——教师队伍不断被纳粹“净化”——找工作——免于服兵役——找工作——到达纽约,继续学业,大学任教

运筹学

运筹学的诞生:二战中英美两国为有效地配置各项资源,请了一些科学家应用逻辑和数学模型来解决来协助解决战略和战术上的问题。
决定用远程轰炸机对付潜艇的最佳使用方案;为防空武器提供射击表;决定靠近前线的军火补给站的最佳选址;甚至还要解决军队的食物补给问题。
战争结束后,运筹学的应用由战场搬到了商场。运筹学用来组织工厂里的生产,找出仓库与销售部门之间的最优关系,解决许多别的商务问题,均衡有限的资源,或改进生产与提高产量。
运筹学是近代应用数学的一个分支,主要是研究如何将生产、管理等事件中出现的运筹问题加以提炼,然后利用数学方法进行解决的学科。
分支有:数学规划(线性规划、非线性规划、整数规划、目标规划、动态规划、参数规划、随机规划、组合最优化)、图论、排队论、存贮论、对策论(博弈论)、决策论、搜索论、统筹论、最优化

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值