关于2021年的诺贝尔经济学奖,瑞典皇家科学院将卡德的主要贡献,定位在引领了“自然实验在经济学中的兴起”;而将安格里斯特和因本斯的主要贡献,定位在建立了“因果推断的方法论”。
本届诺奖揭晓以后,出现了不少文章介绍自然实验在经济学中应用的经典案例,包括我在上一篇文章中提到的利用父母对“儿女双全”的偏好,将“三胎选择”这一内生决策转变为基于随机决定的前两个孩子的性别组合的外生决策(详见《诺奖得主安格里斯特①:从功夫世界中走出来的计量经济学大师》,2021-11-16,澎湃商学院)。
然而,对于安格里斯特和因本斯这次获诺奖的核心贡献,即两人1994年合作发表的《局部平均因果效应的识别和估计》一文中提出的因果推断方法,可能由于其逻辑推演上的复杂性,尚未见有文章向公众进行科普性的讲解。有鉴于此,我在此篇中尝试以尽可能通俗的语言来介绍这一因果推断方法。
如何通过“随机社会实验”进行因果推断?为了便于解释,我们从一个例子着手:参加就业培训对提高失业者再就业率的因果效应。对于失业的人,是否参加就业培训是一个基于自身各方面条件的“内生选择”。比如,有着急切就业需求的人,可能选择参加就业培训并积极寻找新的工作;而就业需求非常低的人,可能直接选择“躺平”,既不参加就业培训,也放弃寻找新工作。由于参加就业培训与否与个人技能及寻找新工作的努力程度有着紧密的关系,我们不能直接将“参加培训”的人和“不参加培训”的人再就业率的差异,归结于参加就业培训的因果效应。
为了解答参加就业培训对提高再就业率的因果效应,我们需要借助上一篇中提到的“工具变量”,即能够改变
一部分人参加就业培训决策的外在因素,将他们的决定由“内生选择”转变为“外生选择”。这里,最理想的“工具变量”,就是进行一个“随机社会实验”(randomized social experiment),通过外在因素对一部分人是否参加培训的决定施加影响。具体而言,我们可以将样本中的失业人士随机分配到实验组和对照组,向实验组提供详细的就业培训资讯,并鼓励督促他们参加;而对对照组不进行任何干预。
与自然科学实验不同,社会科学领域的随机实验或准实验,并不能强迫任何人必须接受指定的分配。这导致分配到实验组的个人,未必全部选择“参加培训”;而分配到对照组的个人,也未必全部选择“不参加培训”。根据社会实验的随机分组和是否参加培训的个人选择之间的关系,整体样本中的个人可分为三类:
“始终参加者”(always takers):无论分配在实验组还是对照组,都会选择“参加培训”;
“始终不参加者”(never takers):无论分配在实验组还是对照组,都会选择“不参加培训”;
“分配依从者”(compliers):是否参加培训的选择依从随机分组的结果,当分配到实验组时会选择“参加培训”,当分配到对照组时会选择“不参加培训”。
上述三类人中,只有“分配依从者”因为分配到实验组或对照组而做出了不同的选择,使得识别针对这一特定群体的因果效应成为了可能。
下面,我将通过一张图,来解释因果推断方法在一个具体的“随机社会实验”中的应用。图中每个图标代表一个人,20位失业人士被随机分配到10人的实验组和10人的对照组。图标的形状对应上述的三类人:圆圈代表“始终参加者”,三角形代表“始终不参加者”,方块代表“分配依从者”。图标的填充方式代表再就业状况,实心表示找到了新工作,空心表示未找到新工作。

如果我们简单地对比实际参加培训的12个人与实际未参加培训的8个人,前者的再就业率为75%(9/12),后者的再就业率为25%(2/8),相差了50个百分点。但由于实验组中“始终不参加者”和对照组中“始终参加者”的存在,即使在这一“随机社会实验”中,参加培训与否仍然是一个内生决策。因此我们将这两组人再就业率上的差距归结于参加培训的因果效应。

那么,在这一“随机社会实验”中,安格里斯特和因本斯提出的因果推断方法应该如何应用呢?
首先,对照组10人中有4人仍然选择了参加培训,推断出对照组中“始终参加者”的比例为40%。由于实验组和对照组是随机分配的,“始终参加者”在实验组占比也是40%。
其次,实验组10人中有2人仍然选择不参加培训,推断出“始终不参加者”在实验组中的比例是20%。由于前面已经得知实验组“始终参加者”占比为40%,进一步推断出“分配依从者”在实验组中占比40%(100%-40%-20%),同样也适用于对照组。
再次,实验组和对照组的再就业率分别为60%和50%。对于“始终参加者”和“始终不参加者”,他们参加培训的选择和再就业的状况,均不受分组的影响。因此,实验组和对照组之间10个百分点的再就业率的差异,只能由两组中“分配依从者”再就业率不同所导致。考虑到“分配依从者”在两组中占比均为40%,“分配依从者”在实验组中的再就业率,需要比在对照组中高出25个百分点(10%/40%),才能使得实验组整体的平均就业率高出对照组10个百分点。
最后,实验组和对照组中的“分配依从者”唯一的区别是:前者参加了就业培训,而在后者没有参加就业培训。因此推断出“参加就业培训”提高了实验组中“分配依从者”再就业率25个百分点。因为最终推断出的平均因果效应仅适用于“分配依从者”,而非整体样本,所以被称作“局部平均因果效应”。
上述推理中用到的“局部平均因果效应”的理论框架,直到1994年才在安格里斯特和因本斯合作发表的文章中正式提出。但这一构想,可以追溯到安格里斯特1989年在普林斯顿完成的博士论文:《越战时期抽签征兵制度的计量经济学分析》。
服兵役会影响长期收入吗?越南战争期间,美国政府需要征召适龄男子入伍。但基于越南战争的有限规模,政府并不需要征召所有的适龄男子,于是决定根据生日进行抽签,只对生日抽到的签号比较小的人动用征召权利。安格里斯特使用根据生日抽签的结果,作为服兵役的“工具变量”,来研究在越南战争期间服兵役对长期收入的影响。
在这一案例中,“始终参加者”,是那些即使生日未被抽中也会自愿入伍服役的人;“分配依从者”,是那些只有因为生日抽中被征召才会服兵役的人;而“始终不参加者”,则是那些即使生日抽中被征召也会以各种理由逃脱兵役的人。例如,美国前总统特朗普就是一位“始终不参加者”:他通过出具医生提供的“脚上长了骨刺”的诊断证明,成功免除了兵役。
由于“始终参加者”的存在,未被征召的人中,仍然有相当一部分人自愿入伍。同样,由于“始终不参加者”的存在,被征召的人中也有相当多的人最终没有服兵役。但由于“分配依赖者”的存在,被征召的人服兵役的比例,仍然远远高于未被征召的人。
安格里斯特在研究中发现,因政府征召才服兵役的越战老兵(即“分配依从者”)退役10年后的收入,比因为没有被政府征召而未服役的同龄人低了15%,大致相当于因为服役减少了两年工作经验所带来的损失。
结语本篇尝试以尽可能通俗的语言和实例,介绍安格里斯特和因本斯这次获诺奖的核心贡献——因果推断方法。这一因果推断理论框架的提出,为基于自然实验的研究中得到的实证结果,提供了准确的因果解释,是推动经济学走向实证化具有划时代意义的里程碑。在接下来的文章中,我将通过更多的实证研究案例来进一步介绍,这一因果推断理论在识别现实生活中的因果关系的应用。
(作者张宏亮为香港浸会大学工商管理学院经济学副教授,麻省理工学院经济学博士)