表格的优点和缺点
优点:表格很方便,能够根据表格对数据做出解释。
缺点:除非变量间有明显的关系,否则看起来比较含糊。
本章出现的名词定义
contingency table 列联表:
描述自变量和因变量之间可能关系的表格。
control variable 控制变量:
可能对两个变量间的关系产生影响的第三方变量。
spurious relationship 虚假关系/伪关系:
指在两个没有因果关系的事件之间,基于一些其他未见的因素(干扰因素confounding factor,或潜在变量lurking variable),而推断出因果关系。这会引致“两个事件是有所联系”的假象,但这种联系并不能通过客观的试验。(from 百科)
antecedent variable 先行变量:
最初导致变化的变量。
intervening variable 中介变量/介入变量:
将前因变量带来的变化传递给因变量的变量。
【重点】给数据分类的原则:
A.reducing the number of class intervals to a manageable number(3 or 4 categories)
B.having in each category at least a few cases,if possible,a roughly equal number of cases in each class interval.
【重点】对于表格的处理:
表头命名规则:
因变量,by 自变量
例如:Political Rights,by Per Capita GDP
表格中需要注意的细节事项:
(1)必须加%的位置:
upper left-hand cell(左上角);bottoms(底层)
(2)有时候total并不等于100%,是因为 rounding error 的存在,导致细小偏差。
例如 Column 3 的total是99.8%
(3)在底部标注n=,列出自变量的数量,方便原始检验。
(4)别忘记脚注标注引用资料的来源和页数,否则就是抄袭警告~
对于变量是否存在相关/因果关系的检验:
partial table 分表
自变量(I):性别
因变量(D):对于军事干预的态度
控制变量(C):种族
因果模型
此处略写,放一张图解释一下先行变量和中介变量。