NCA学习第一弹来啦

目录

一、NCA基础问题Q&A

Q:NCA是什么?与QCA有何关系?

Q:如何使用NCA方法?

Q:关于概念、理论、研究设计、数据分析及方法局限的所有问题解决途径?

Q:回归与QCA、NCA之间的关联举例?

二、NCA简单操作步骤

(1)操作步骤整理

A.安装R软件

B.在R软件中安装NCA包

C.导入NCA分析所需数据

D.分析效应量与显著性

E.分析瓶颈水平

(2)官网操作案例——双变量NCA

A.理论知识

B.背景介绍

C.数据分析的核心详细分析步骤

(3)官网案例——多变量NCA

三、NCA学习资源推荐

四、参考引用


一、NCA基础问题Q&A

Q:NCA是什么?与QCA有何关系?

A1:NCA(Necessary Condition Analysis,必要条件分析),其是对必要条件的分析,可作为QCA分析方法的补充。

        QCA可以在类别上(in kind)判断一个条件是不是必要条件,而NCA可以在程度上(in degree)判断必要条件,即“要达到特定水平的Y,X至少要多少?”,即X限制了Y的水平,Y受限于X。

A2:定性比较分析法(QCA)可以识别必要条件,但其只是定性地陈述“一个条件对于一个结果是必要的还是不必要的”,没有定量地体现必要程度,即“一个条件在什么程度时才是一个结果的必要条件”。而必要条件分析(NCA)还可以在程度上判断必要条件.

        例如,如果想达到特定水平的Y,X至少要达到多少?(即Y的水平受限于X的水平,X的水平限制了Y的水平,特定水平的X对于特定水平的Y来说是必要的)

Q:如何使用NCA方法?

A:官方网站推荐有三种方法可以使用NCA,并检查您的数据是否可能包含必要的条件。

        (1)散点图的目视检查。检查观测值的 XY 散点图是评估数据是否可能包含必要条件的最简单方法。当条件 X 的值水平向右增加,结果 Y 的值垂直向上增加时,散点图左上角的空白区域(没有观测值的空间)可能表明您已找到必要条件。

        (2)NCA 计算器。使用资源1上的NCA计算器是运行定量NCA分析的另一种快速方法。NCA 计算器给出的效应大小大于 0 时(特别是当它大于 0.1 时),就可判断为必要的条件。

        (3)NCA软件。可以使用R语言中的包  NCA R 版软件运行完整的 NCA 进行计算,教程可参照官网的http://ssrn.com/abstract=2624981http://ssrn.com/abstract=2624981

Q:关于概念、理论、研究设计、数据分析及方法局限的所有问题解决途径?

A:官方来源网站(资源1)已全部囊括在内了(建议去原官方网站看哈)

Q:回归与QCA、NCA之间的关联举例?

A:回答整理自:https://www.douban.com/group/topic/201527195/?_i=7672445qwn5ILj

        (Regression)回归研究单个变量的净效应(net effect), 且这个变量对因变量的净效应发挥的是充分而不必要作用,也即自变量会促成因变量的产生,但是没有了这个自变量,那因变量还是会照样产生,因为有其他自变量可以弥补(compensate)这个缺失。(但问题现实世界里,有些变量的缺失对因变量造成的影响往往是难以弥补的。

        QCA的逻辑主要是充分性分析,(虽然它这个也可以检测必要条件是否存在),同样是分析充分性,QCA重点分析组态的充分性,也就是各种条件的不同组合对结果产生的影响。也可以理解为交互作用。因为在现实世界中,假定各种条件变量之间是相互依赖的关系显然更符合实际情况,所以QCA是比较摒弃单个变量的净效应,可以探究很多个条件变量间的组合效应对结果产生的影响(通常而言3-9个前因变量最常见),也可不同组态对达成结果的等价性(equifinality)。

        NCA的逻辑就是探究单个变量的必要非充分性,也就是说满足了这个条件不一定就能催生结果(非充分性),但是缺少了这个条件肯定不能产生结果(必要性)。这个条件叫必要条件,因为这个条件对结果的产生来说是非常有必要的。

二、NCA简单操作步骤

        伊拉斯姆斯大学官网上提供在线的NCA分析(即 NCA calculator,在线网址:NCA Calculator),但其提供的NCA结果信息相当有限,故文本推荐安装R和Rstudio使用Necessary Condition Analysis包就能进行必要条件分析。

(1)操作步骤整理

A.安装R软件

用户类别下载网址安装粗略步骤
Windows用户http://cran.r-project.org/bin/windows/base打开下载的R安装包并按照说明操作(接受所有默认值
OS X(Mac)用户http://cran.r-project.org/bin/macosx/

        安装成功后的步骤如下图所示:


B.在R软件中安装NCA包


        安装该包的步骤可归纳为安装包、升级包、和激活包三步,其中第三步每一次使用该包都需要。

#第一步安装NCA
#在红色箭头号后,输入代码
install.packages("NCA", dependencies = TRUE)

#敲Enter键,会跳出来右边的地址框,选中离你最近的省市,点击OK之后,NCA软件包成功安装。



#第二步更新NCA软件包

#在红色箭头号后,输入代码
update.packages()

#敲Enter键,会跳出更新确认框,一直点是即可,可以看到跳出更新完毕询问框,点击是即可。



#第三步激活和加载NCA包
#在红色箭头号后,输入代码
library(NCA)

#敲Enter键,NCA包成功导入R软件。



C.导入NCA分析所需数据

#第一步准备数据
#去掉数据中的变量名、序号等,只保留要分析的数据,前面是前因条件,最后是结果条件。


#第二步输入数据路径代码
#本文已校准的示例数据名称为“数据名称示例”,格式为csv,文件在桌面,路径代码为:
data <- read.csv("C:\\Users\\10405\\Desktop\\数据名称示例.csv",header = FALSE)。

D.分析效应量与显著性

​#效应量是指产生特定结果需要必要条件的最低水平,取值范围为0~1之间,数值越趋近于1表示效应#量越大,小于0.1则说明效应量很小。


#NCA包可以调用上限回归(ceiling regression,CR)技术分析连续变量和超过5级的离散变量,使用上限#包络(ceiling envelopment,CE)技术分析二分变量和不到5级的离散变量。    
#具体根据数据特征选择不同的分析技术,也可以同时汇报CR和CE的计算结果,比较结果的稳健性。基于#Dul等(2020)给出的衡量标准,必要条件的效应量(d)需大于0.1且达到显著性水平(P<0.01)。
分析效应量与显著性的代码如下:
model<-nca_analysis(data,X,Y,ceilings="cr_fdh", test.rep=10000)
nca_output(model, test=TRUE)


#其中,X是指前因条件,Y指结果条件;cr_fdh表示使用上限回归(ceiling regression,CR)技 
#术分析;test.rep=10000表示重抽次数为10000次。
#示例为前因条件X1对结果条件Y的必要性分析,分析方法为CR。
同理,将分析效应量与显著性的代码中的cr改为ce,分析方法换为CE。


    以此对所有的前因条件进行必要性分析,将上述指标汇总后制表,。综合来看,没有一个前因条件同时满足效应量和显著性两个要求。所以得出结论:前因条件都不是结果条件的必要条件。

​


E.分析瓶颈水平

    瓶颈水平(%)指达到结果最大观测范围的某一水平,前因条件最大观测范围内需要满足的水平值(%)。瓶颈水平分析代码为:
model <- nca_analysis (data,c(X1:XN),Y)
nca_output(model, summaries=FALSE, bottlenecks=TRUE)


其中,X1:XN表示前因条件的范围,是第几列到第N列,Y表示结果条件。
示例中的数据,第一列到第九列为前因条件,第十列为结果条件,所以代码表示为:
model <- nca_analysis (data,c(1:9),10)
nca_output(model, summaries=FALSE, bottlenecks=TRUE)


    程序会汇报使用CR和CE两种方法进行分析的瓶颈水平结果。
    最后,将上述结果制表,如表2所示。要达到60%的Y水平,需要0.4%水平的X1、2.3%水平的X3、0.2%水平的X5、1.4%水平的X7,而X2、X4、X6、X8、X9不存在瓶颈水平。


(2)官网操作案例——双变量NCA

        双变量 NCA案例关于双变量 NCA(一个 X=条件,一个 Y=结果)。

A.理论知识

        假设研究人员探索或检验了一个关于一个国家的文化价值观与一个国家的创新绩效之间关系的必要性理论,由以下必要性假设表示:

        H1 个人主义是创新绩效的必要条件。

        请注意,通常的假设,如“如果个人主义更高,那么(很可能)创新绩效更高”是充分性假设。另请注意,常用的一般假设(“个人主义对创新绩效有影响”、“个人主义与创新绩效相关”、“个人主义影响创新绩效”等)被解释为充分性假设,尽管它们也可以解释或指定为必要性假设。

B.背景介绍

        假设样本由 28 个国家/地区组成(自变量和因变量的数据可用)。测量:假设个人主义的分数是从Hofstede(1980)的文化维度获得的,一个国家的创新表现的分数是从Gans和Stern(2003)的创新指数中获得的,并且这些分数是有效和可靠的。

C.数据分析的核心详细分析步骤

        通过六个步骤(Dul,2016,表3和4),可以使用NCA探索或测试必要性假设:

第 1 步:制作散点图。

        为 (X=个人主义,Y=创新绩效)制作 XY 散点图,其中 X 轴为“水平”,Y 轴为“垂直”,值向“向右”和“向上”增加。下面显示了示例散点图。

        每个点代表一个案例(国家/地区)。个人主义得分(X)从18到91,创新绩效得分(Y)从1.2到214.4。

第二步:确定空白区域

        目视检查散点图的左上角是否为空。考虑在“空白空间”中允许一些例外(例如,所有观察结果的5%)。如果没有“空白空间”(因此左上角有观测值),则不存在必要条件,并且可以拒绝必要性假设。在示例散点图中,左上角有一个空白区域,表明可能存在必要条件。

第 3 步:绘制天花板线

        选择两种天花板线技术之一:

  • CE-FDH(红色):带有自由处置船体的天花板围护结构(CE-FDH)。这是一个分段线性函数,可以在数据离散(X 变量的几个可能水平)时使用。
  • CR-FDH(橙色):使用自由处置船体的天花板回归(CE-FDH)。这是一条直线,当数据和潜在现象(近似)连续(X 变量的大量可能水平)时可以使用。

        CE-FDH 天花板线是红色虚线,可以通过从对应于最低观测值 X 值和最低观测值 Y 值 (0,0) 的 XY 点开始手动绘制,然后垂直向上移动到具有最大 Y 的观测值表示最低 X(可以有多个具有相同 X 值的观测值, 特别是对于离散变量),然后水平向右移动,直到在此水平线上或上方具有观测值的点(丢弃此线下方的观测值)。然后垂直向上移动到此 X 具有最大 Y 的观测值(同样,可以有多个具有相同 X 值的观测值,特别是对于离散变量),并继续此过程直到最后一个点。

        CR-FDH 天花板线是橙色线,它是穿过 CE-FDH 阶跃函数左上边缘(“西北”角)的普通最小二乘趋势线。CR-FDH平滑CE-FDH。

        (NCA软件或NCA计算器可用于在散点图中绘制这些线。这两个工具都包含此示例。)

第 4 步:量化 NCA 参数

        在这个例子中,我们计算了CR-FDH天花板线的NCA参数。参数可以使用NCA软件计算。

        范围:给定最高和最低 X 和 Y 值可以预期观测的区域:将最高值减去最低 X 值,最高值减最低 Y 值。例如,作用域的值为 (91 - 18) x (214.4 - 1.2) = 15564

        天花板区域:“空白空间”的大小。例如,这是橙色 CR-FDH 天花板线上方的区域,即 4773。

效果大小 (d):将天花板区域除以范围。例如,效应大小的值为 0.307。效应大小是最重要的NCA参数之一。它表示条件限制结果的程度。

        准确度:不在“空白空间”中的观测值数除以观测值总数,乘以 100%。对于示例,准确度值为 92.9%,因为两个观测值位于橙色上限线上方。

        两个更高级的NCA参数是条件低效和结果低效条件低效是条件范围的百分比,其中条件对于结果不是必需的。例如,条件低效的值为 10.3%,表明只有大约 10% 的 X 范围(最高级别),条件不会约束结果(因此,对于几乎 90% 的 X 范围,X 约束 Y)。结果低效是条件对结果不是必需的结果范围的百分比。例如,结果低效率的值为 31.6 %,表明对于大约 1/3 的 Y 范围(较低水平),结果不受条件约束(因此,对于超过 2/3 的 Y 范围,Y 受 X 约束)。

第5步:评估效果大小和准确性

        评估效应大小 (d 在当前上下文中是否具有理论或实践意义。考虑使用一般基准0 < d < 0.1“小效应”,0.1 ≤ d < 0.3“中等效应”,0.3 ≤ d <0.5“大效应”,d 0.5“非常大效应”。将准确度与 95% 的基准进行比较。如果认为效果大小和精度足够大,请继续执行步骤 6。在该示例中,必要性效应大小可以被视为对中等效应大小有意义。由于观测值数量较少,其中 2 个观测值高于上限线,因此精度有些低。

第 6 步:制定必要的条件

        如果研究人员从步骤5中得出结论,当前样本中存在必要条件,则可以将必要条件概括为“个人主义对于创新绩效是必要的”。此外,通过制定上限线Yc = 2.2Xc + 28.4,指示哪个级别的Yc需要哪个最低Xc水平,可以更详细地制定必要条件(以度为单位)。天花板线的斜率和截距是用NCA软件计算的。

警告:就像任何其他研究方法和数据分析技术一样,NCA有几个局限性

(3)官网案例——多变量NCA

        此案例关于多个 NCA(多个 X,一个 Y)。在多个NCA中,有多个潜在的必要条件(X1,X2,...)和一个结果(Y)。

A.案例背景:

多个国家竞争管理局,然后有两个必要性假设:

H1 个人主义是创新绩效的必要条件。

H2 承担风险对于创新绩效是必要的。

        对于多个NCA,首先分别对每个条件进行双变量分析,因为必要条件独立于因果结构的其余部分运行。因此,重复步骤 1-6 以进行冒险。事实证明,当使用NCA软件或NCA计算器时,风险承担对于效果大小为0.282的创新性能也是必要的,这可以被视为中等效果大小。

        具有两个必要条件的多 NCA 是必要的 AND 配置,可以用天花板表面表示。对于多个NCA的解释,瓶颈表可能会有所帮助。瓶颈表是一个或多个必要条件的上限线的表格表示。它显示了给定水平的结果(Y=创新绩效)所需的必要条件水平(X1=个人主义,X2=冒险),见下文。

Y        X1         X2

0        NN         NN

10       NN         NN
 
20       NN         NN

30       NN        8.0

40      11.0       17.1

50      24.1       26.2

60      37.2       35.2

70      50.3       44.3

80      63.4       53.4

90      76.5       62.4

100     89.6        71.5

        条件和结果的水平表示为范围的百分比:0 是最小观测值,100 是最大观测值,50 是这两个值之间的值。示例的瓶颈表显示,对于结果 Y=20 的水平,不需要个人主义的最小值 (X1),也不需要风险承担的最小值 (X2) 来实现(NN= 不需要)。但是,对于 Y=30,冒险需要最小值 8.0,对于 Y=40,个人主义需要最小值 11.0,冒险需要最小值 17.1。对于 Y=100(最大创新绩效),个人主义的最小值为 89.6,风险承担的最小值为 71.5。如果在实践中没有达到这些最低水平之一,则不会发生结果 Y=100。因此,每个条件都可能成为瓶颈。

三、NCA学习资源推荐

(1)强推NCA官方介绍网站:https://www.erim.eur.nl/necessary-condition-analysis/

        该网站为荷兰伊拉斯姆斯大学NCA项目官网,里面有操作介绍、操作步骤及案例等全部资源,本博客部分内容就出自此处。

(2)关于必要条件分析的大规模开放在线课程(MOOC)已在Coursera上发布。

        链接:Necessary Condition Analysis (NCA) | Coursera

(3)杜运周老师翻译的《必要条件分析》

四、参考引用

[1]研究方法 | NCA:必要条件分析的软件操作步骤 - 知乎 (zhihu.com)

  • 7
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 8
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

封印师请假去地球钓鱼

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值