《女士品茶》读书笔记

书的名字来源于统计学史上著名事件,也就是假设检验的原型:费希尔对一位声称自己能够分清午茶是先加奶还是先加茶。

书的主要内容不是统计学的各种公式,而是各种公式、定理的来由,以及其发现者的故事。

简单地,做一下今天所看内容的笔记:

卡尔·皮尔逊,19世纪90年代,英国皇家统计协会的成员,在当时的统计学界很有威望,出身居然不是理学,而是政治学 。读完硕士之后,迷上马克思,而他后来差不多是倾向共产主义,著作有《科学的语法》(应该是本很有意思的书,拉进书单地干活)。

而相比较之下,费希尔,出现的比较晚,起码晚于皮尔逊,这导致了他在当时的一些权威统计学期刊上不得志(也就是不能登自己的文章)。皮尔逊的“专业”、“权威”地位只是一方面原因,我觉得,更多地是,表达能力的问题。费希尔是个超高度近视眼,这使得他少年时期不得深夜读书,于是数学老师基本只能把数学书唱给他听。。而这恰恰培养了他的逻辑、几何抽象能力,之后费希尔在几何方面牛刀小试,而后做数学研究,可谓是高产。不过,可悲地是,无人欣赏--因为看不懂,这还真是脑子太先进的弊端:配不上周围猪一样的队友。他的思考能力强 表达能力弱 不仅体现在这些高深的科研之上,还有他后来的教学生涯:他常常会被学生不明白一些很简单的 他自己说的 ,应该没别的人这么想  东西而气得不轻……(估计,做他的学生也是件苦力活。。)再说,费希尔的其他方面,学霸级的人物,剑桥高材生,与之相连的,还有法西斯主义,也许有点妄言,但起码有类似的倾向:参与优生学(大概就是资助穷人的话,会助力他们繁衍后代和中产阶级的后代争夺资源,这样代复一代之后,“坏基因”越来越多,而“好基因”渐渐消亡)……这么聪明的脑子,怎么就这么想不开呢。。写点统计学相关的东西吧,给大牛皮尔逊,皮尔逊看不懂,转身给了大牛戈塞特,戈塞特也看不懂,于是只能投稿在一些不怎么出名的农学、生物学杂志上,有些居然还是费希尔本人自掏腰包才肯刊登,简直暴殄天物。后来,一位瑞典数学家 克拉默 发现了费希尔的研究作品(主要是二战期间,国国(除了瑞典吧)都忙着打仗,这位瑞典人与国际科学界失联 没人玩了),开始研究费希尔研究的东西,发现有些正是当时科研人所作的。所谓,写《红楼梦》是一个工程,写完之后读《红楼梦》又是另外一个工程。没得办法,谁让克拉默不早点遇见费希尔,这样就可以像霍金那样 活着的时候就能做科学界的巨人…

卡尔·皮尔逊和费希尔二位大牛老是闹不和,不过,科研人怎么能够张口就骂人呢?于是二人一致采取在自己的刊登文章中指出对方的错误的手段,宣泄不满  共话统计学的发展 。这么下去,倒也不会引发战争,但是,矛盾还是需要调解员的,这个调解员就是大牛戈塞特。

在吉尼斯酿酒公司工作时,戈塞特思考如何优化酿酒所需的酵母菌数量,发现了酵母菌的繁殖符合泊松分布。值得注意的是,泊松分布并不是第一次出现在人们面前,只是大家不太能找到什么事件是符合泊松分布的。不过,这家公司禁止员工发表论文,担心会泄露公司的经营秘密。于是,戈塞特只好给自己取个笔名“学生”,发表在《生物统计》上。

《生物统计》是高尔顿、皮尔逊、韦尔登三人创办的一个期刊,令我惊讶的是,统计之初不是为商业,而是为生物。高尔顿原本计划研究人类智力的发展,奈何没有评价智力的指标,就把目标转向了人类身高上,也就是著名的父子身高的平均回归。皮尔逊他们创建该期刊,是为了给同胞达尔文的进化学说提供理论支持。后来,高尔顿和韦尔登接连辞世,《生物统计》自然就是皮尔逊的囊中之物了。

戈塞特的t检验,明显特征是小样本。塞戈特经常自己动手计算统计量,不觉地想到我考统计课程的时候,拿着计算器,算几遍都算不对的囧  つ﹏⊂ ,深谙这当中的不容易啊,虽然是小样本(粗略说,大概是30个样本观测值以下)。

皮尔逊提出偏斜分布的概念,偏斜分布由四个数值确定,分别是均值(观测值分布的中间值)、标准差(大多数观测值相对于均值的分散程度)、对称度(观测值偏向均值一边的程度,我觉得,大概就是教材上的偏度吧)、峰度(罕见观测值相对均值的分散程度)。这一思想的提出,将过去科学以确切的实物为研究对象,转变成描述观测的事物随机性的数学函数。果然,就像马爷爷说的那样,人类对事物本质的认识是呈螺旋式上升的。

南丁格尔,一位女统计学工作者(这是在这本书中不多出现的),称自己是小人物,对着皮尔逊、费希尔、戈塞特等等这些大牛,称自己是小人物或许也是一件很骄傲的事吧🤔🤔

内曼,年少时深深崇拜着勒贝格(就是发明勒贝格积分的那位),有朝一日终于遇见了勒贝格,却被其冷冷对待甚至可以说是无礼,于是之后内曼先生的教人写书活动中处处充满着友好、和蔼的意味,这么想勒贝格也是教会了内曼点什么……只是方式不太恰当。

柯尔莫哥洛夫,听名字这么长就知道是位俄国数学家,再看结尾是-夫-就知道是位男数学家。在印象中,他大概是这本书里出现的继费希尔之后的第二位数学天才。其贡献在于奠定了概率论的理论基础,并给出合理的解释,这么说似乎是很笼统……反正是个很伟大的人。

列昂惕夫提出投入-产出模型,将矩阵引入实际问题的解决中,奈何矩阵逆的计算是项“锤炼灵魂的仪式”(书里的原话),好在和佛的计算机出现了,不过,那群会计谨遵上级指示,不肯给服务型消费报账(比如花钱让哈佛的计算机给矩阵求逆这种服务是不能报账的),再三协商之下,开出一张“像哈佛购买一个逆矩阵”的单子才得以完成报账。(这里也有个名人似乎是汉森,就是抽样调查 书里的那位)

图基,这位美国大佬,似乎距离现在并不很远,但是他的发明却出现在各个行业、领域,比如******记不清了***后面再补

 


施蒂格勒误称定律:大概意思是一般地,一个定律如果选一个科学家的名字命名,那么这个定律很有可能并不是这个科学家所发现的。比如,高斯分布、泊松分布,洛必达法则貌似也是

未完待续……

 

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值