因果推断中文书单整理及简介
书单总目录
- 书单1: 为什么:关于因果关系的新科学[2019]
- 书单2: 别拿相关当因果!因果关系简易入门[2016]
- 书单3: 倾向值分析:统计方法与应用[2012]
- 书单4: 基本无害的计量经济学:实证研究者指南[2012])
- 书单5:原因与结果的经济学[2016]
2021-4-21更新加入书单6 - 书单6:[book1: Causal Inference: What If[2020]]【中文版】[2021]
- 书单7:调节效应和中介效应分析[2012]
- 书单8:基本有用的计量经济学[2017]
书单1: 为什么:关于因果关系的新科学[2019]
THE BOOK OF WHY : THE NEW SCIENCE OF CAUSE AND EFFECT , Judea pearl
1.1 简介
Pearl的《为什么》是笔者所知道的目前已出版的唯一一部因果关系科学方面的科普著作,作者在其中深入浅出地把因果关系科学的理论框架及其发展脉络展现给了读者。值得一提的是,那些曾经令人备感困惑的悖论作为经典统计学中的未解之谜,最终也经由因果关系分析而拨云见日,笼罩在其上的迷雾也随之烟消云散了。水落石出后,因果推断显得如此自然,就仿佛一切本该如此。对于每一位想了解因果关系科学的读者来说,以《为什么》为起点就意味着你踏上了一条捷径,在理解此书的基础上阅读因果关系科学方面的专业著作,你的收获将会更大。
1.2 目录
这本书共305页,十章。
书单2: 别拿相关当因果!因果关系简易入门[2016]
2.1 简介
研究因果关系的方法有很多种(有些是互补的,有些是对立的),而且涉及众多领域(包括哲学、计算机科学、心理学、经济学、医学等)。我无意在这些争辩中选择立场,只想为读者呈现各种观点,厘清各种观点之间的共识与分歧。除此之外,我们还将探讨关于因果关系的心理学(人们是如何了解原因的)、如何进行因果关系的实验(以及这些实验的局限性是什么),以及如何根据因果关系来制定相应的策略(我们是否应该减少食物的含盐量,以此来预防高血压)。
我们首先要弄清楚什么是原因,以及为什么我们常常会弄错事情发生的原因(第1~3章)。然后,要认识到在原因的理解和运用方面,“什么时候”与“为什么”同等重要(第4章)。接着,要学习如何只通过观察就找到事情发生的原因(第5章)。大型数据集可以让我们找到事情发生的原因,而不是简单用来检验我们的假设。但是我们必须认识到,并不是所有的数据都能用来推理事件发生的原因。在第6章,我们将考察数据特征对推理的影响。第7章将探索在可以做实验的情况下,如何去克服这些数据特征给我们带来的挑战。这里所说的实验可能是复杂的临床试验,也可能只是某人对自己不同锻炼计划所做的对比实验。通常情况与个别情况之间的差异,正是我们需要使用专业性策略对各种事件做出解释的原因(第8章讨论的内容)。但是,要想利用因果关系来制定有效的干预措施,如在菜单上提供食品热量信息来降低肥胖症发生的概率,就需要有更多的信息,而且很多干预措施还可能带来意想不到的后果(第9章将详述这一点)。本书将会告诉你为什么因果关系如此难找(比报纸文章告诉你的要更细致、更复杂),以及为什么尽管如此,它仍是一个相当重要且广泛适用的话题。
2.2 目录
这本书共244页,10章。
书单3: 倾向值分析:统计方法与应用[2012]
3.1 简介
这是一本介绍当代因果分析方法的书。他系统介绍了美国关于因果分析的四种前沿统计方法。,本书集中关注紧密联系但在技术上又相互区别的用于评估计干预效应的四种模型:①Heckman 的样本选择模型(Heckman 's sample selection model))(Heckman ,1976,1978,1979)及其改进形式;②倾向值匹配(propensity score matching )(Rosenbaum &Rubin ,1983)及有关的模型;③匹配估计量(matching estimators )(Abadie &Imbens ,20022006);④以非参数回归进行的倾向值分析(Heckman ,Ichimura,&Todd,1997,1998)
在介绍这些新方法的过程中,本书的写作和准备以两个基本目标为指引。第一个目标是围绕着这四种倾向值分析模型向读者介绍它们的源起、主要特征和争论。我们希望这一介绍能有助于实现我们的第二个目标,即阐明一些新的思路、概念和方法,社会行为研究者们可将它们应用到自己的研究领域来解决可能遇到的问题。此外,本书还有两个最高目标。我们的主要目标是以一种更不技术性且更实用的方式对分析方法在过去30年中的理论和技术进步加以介绍,使其易于理解且便于应用。第二个目标是推动社会行为研究者们就使用非实验方法估计因果效应的挑战、策略和最佳方法进行讨论。
3.2 目录
这本书共268页,七章。
书单4:基本无害的计量经济学:实证研究者指南[2012]
4.1 简介
本书为实证研究者把握计量经济学的精义提供了一个向导,这些计量经济学的精义也就是我们所指的基本无害的计量经济学(Mostly Harmless Econometrics)在应用计量经济学家的工具箱中,最重要的几件工具可以列举如下:
(1)为了将可能掩盖因果关系的变量控制起来,而设计的回归模型(Regression Model )
(2)用于分析真实实验以及自然实验的工具变量方法(Instrumental Variables Method )
(3)在重复观察中用以处理不可观察的缺失变量的双重差分方法((Difference-in-Difference Strategies )。
对上面这些基本技巧的创造性使用要求读者对统计推断的作用机理有坚实的概念基础和良好的理解。应用计量经济学在这两方面的特点将会在本书中得到体现。
许多计量经济学方面的教科书都对研究方法提供一些指导,因此本书和其他广泛使用的教科书存在一些内容上的重叠。但这本书在多个方面有别于传统的计量经济学教科书。首先,我们认为使用数据回答特定因果关系的经验研究最有价值,这类似于在医学研究中经常出现的随机临床实验。我们研究所有问题的方法都体现这个观点。在缺乏真实实验时,我们寻找经过良好控制的对照组,或者说自然的“准实验(quasl-experiment )”。我们要指出的第二个不同是本书在一定程度上忽略严格性。大多数计量经济学教科书都对计量模型进行严格处理。特别的,这些书对诸如线性性和同方差性等大家认为经典模型中普遍会被违背的假设进行大量讨论。虽然在行文中也会提及这些问题,但我们采取一种更加宽容和不那么迁腐的态度。
4.2 目录
这本书共266页,8章。我们从两个作为引言的章节开始。第1章描述了对之后章节可能很有用的研究设计步骤。第2章讨论了在医学研究中用到的随机实验,这个实验为我们最感兴趣的问题提供了一个理想的基准。在引言章节之后,本书第二部分3-5章,分别讨论了回归、工具变量和双重差分法的核心内容。这三章内容既强调估计值的一般性质(比如回归总是可以近似条件期望函数等),也强调了对估计值赋予因果解释所需的假设(比如条件独立假设、工具变量“就像”随机分配、相似世界等)。在本书第三部分我们转入扩展,6-8章。其中第6章考察对非连续实验的回归分析,我们既可将该部分内容看作回归一控制这种研究策略的变体,也可将其看作是一类工具变量估计法。在第7章我们讨论了用分位数回归来估计我们关心的变量对被解释变量分布的影响。最后一章则针对的是统计推断问题,我们在之前章节中对渐进性质进行考察时省略了这一部分内容。本书的一些章节里包含了更具技巧性或者专门性的小节,可以在不影响掌握本书主旨的前提下省略这部分小节都用星号()标出。
书单5:原因与结果的经济学[2016]
5.1 简介
19世纪杰出的美国思想家、作家拉尔夫·爱默生说过这样一句话:“浅薄的人相信运气,强大的人相信因果。”在这个数据泛滥的时代,“因果推理”是我们每个人必备的素养。
本书的目的便在于用浅显易懂的方式详尽讲解因果推理最根本的思维方法。读者可以把本书当作因果推理的“入门的入门”。既然是入门的入门,自然不涉及经济学的基础知识,更不会用到任何公式。
此外,本书还将用大量篇幅介绍经济学中运用因果推理与数据得出的研究成果,说明如何解读这些研究。当今社会,“大数据”已成为脍炙人口的词汇,任何人都能轻而易举地分析数据,但是这并不代表所有人都能正确解读数据分析的结果。若想在大数据时代获得一席之地,不仅要学会分析数据,更要掌握解读数据分析结果的能力。
本书作者之一的中室牧子是教育经济学家,多年来一直致力于运用数据和经济学方法研究何种教育方法能提高儿童的学力及能力。她所提倡的不是基于个人经验的教育论,而是呼吁根据具有因果关系的科学依据来制定育儿及教育政策。
另一名作者津川友介是医生兼医疗政策专家,致力于运用大数据研究如何在改善医疗质量的同时抑制医疗费用的增加。津川师从美国著名医疗经济学家、任教于哈佛大学的约瑟夫·纽豪斯(Joseph Newhouse)以及最早创建因果推理体系的唐纳德·鲁宾(Donald B. Rubin),从他们那里学会了因果推理的思维方法。
教育领域和医疗领域里充斥着无数因果关系混淆的无稽之谈。本书以生活中必不可少的教育和医疗为例,尽可能让各位读者在阅读本书后掌握因果推理的基本思维方法。
5.2 目录
这本书共138页,8章。
书单6:book1: Causal Inference: What If[2020]【中文翻译版本_LJJ(译)】[2021]
6.1 简介
在本书中,强调需认真地对待因果问题,并描绘数据和假设对因果推理的作用。一旦这些基础到位,因果推论必然变得不那么随意,这有助于防止混淆。这本书描述了各种数据分析方法,当收集一个群体中每个个体的数据时,这些方法可以用来估计在一组特定假设下兴趣的因果效应。这本书的一个关键信息是,因果推理不能简化为数据分析的食谱集合。在整篇文章中,穿插了详细阐述正文中提到的某些主题的要点和技术要点。精细点是为所有读者设计的,而技术点是为受过中级统计学培训的读者设计的。这本书对因果推理的概念和方法提供了一个连贯的介绍,这些概念和方法目前分散在几个学科的期刊上。我们希望对因果推理感兴趣的任何人都会对这本书感兴趣,例如流行病学家、统计学家、心理学家、经济学家、社会学家、政治学家、计算机科学家。。
6.2 目录
书单7:调节效应与中介效应分析[2012]
7.1 简介
本书主要包含了调节效应(或交互效应)和中介效应的研究。第一章是矩阵基础,无论读者以前是否学习过矩阵知识,阅读该章可以更好地理解后面各章内容。第二章是协方差结构分析,读者最好是具备结构方程模型基础知识,读完该章会对结构方程模型的思想方法有更深刻的认识。第三章讨论中介效应和调节效应,并对它们作了系统的比较,还讨论了两种效应兼有的复合模型。如果只考虑显变量,这一章只需要有回归分析的基础就可以阅读。第四章讨论潜变量交互效应分析方法,也介绍了潜变量二次效应。第五章讨论潜变量交互效应模型的标准化估计。第六章讨论潜增长交互作用模型,是分析追踪数据的有力工具。第七章讨论多水平结构方程模型,包括多水平中介效应模型。第八章介绍结构方程分析中的模拟研究方法,不仅可以帮助读者理解本书及相关文献中提到的模拟研究,而且还可以让读者学习如何开展模拟研究。
7.2 目录
书单8:基本有用的计量经济学[2017]
8.1 简介
本书用潜在结果语言,从总体视角出发,集中探讨了政策评估过程中常用的因果效应识别策略。全书以随机化实验为基础,首先介绍了潜在结果和分配机制的概念,并利用潜在结果定义因果效应。然后介绍了随机化实验,一种特殊的分配机制,可以消除选择偏差,成为观测研究中各种识别策略的基础。所有的识别策略都是通过一定的设计模拟随机化实验,从而得到可信的因效应估计。另外,作者还简要介绍了因果图方法,它是与潜在结果框架完全等价的因果模型,但是更加直观,容易使用。在这三个理论的基础上,该书介绍了线性回归、匹配方法、工具变量法、面板数据方法和断点回归设计等几种在观测研究中常用的因果效应识别策略。全书的主要特色是用潜在结果语言和因图果介绍各种识别策略。对于每种识别策略,作者还利用具体实例讲解各策略在Stata 软件中的实现
8.2 目录