司马懿,三国英雄士,四朝经济臣 阅读原文 当宣布今年的诺奖给予『没有预料到的实验结果』的时候,我就有预感了,莫非今年的诺奖要给 Angrist 和 Imbens?宣布之后,果然不出所料,只是多了 David Card。 这一次的诺奖是真的实至名归,心悦诚服。因为它并非是像大多数诺奖那样,用于奖励某一个开宗立派的祖师。他们的贡献,尤其是 Angrist 和 Imbens,横跨经济学的各个领域,深刻而显著的影响了整个实证经济学的研究。无数的顶刊文章,很多国家的政策分析,都得益于他们在经济学方法论上的卓越贡献。 可以说,现在经济学家,尤其是做数据、做实证的经济学家,几乎没有人没有读过 Angrist 和 Imbens 的著作,没有人没有用过他们的方法。 在自然科学中,做实验的地位是非常重要的,尤其是在大众的印象里,做实验就等于科学研究。但是在社会科学里面,做实验往往非常的不现实——像一个国家、一个省的医疗保健政策,如何做实验呢?发生了就是发生了,我们也不可能回到没有发生的状态再观察一遍;再比如劳动力的供给,一个地区的劳动力供给就是有限的,而劳动力的自然增长往往和其他的因素密切相关,如何才能知道劳动力供给和工资之间的关系呢?总不能学朱棣从山西大槐树那边强行移民来做实验吧? 这些宏观的、成千上万人参与其中的经济事件,都是没有办法做实验的。但是这些问题,恰恰又是和我们的生活、社会密切相关的问题,一个政策或者规制的效果、区域的劳动力供给……这些问题又需要能找到定量的方法,来进行评估、总结和测试。 怎么办?这就是 Angrist 和 Imbens 的功劳了。 他们开发了「拟自然实验」这个工具,很好的解决了这一问题。 比如说,如果我们要研究政府投资对地区经济增长的作用,直接的比大小是不行的。因为地区的经济增长往往会带来投资,而投资又会促进经济增长,我们不知道他们谁先谁后,因果混杂在一起,直接进行数据分析往往得到的参数就是不准确的。这个也称之为「内生性」。内生性是经济学研究的大敌,可以说整个计量经济学,很大一部分围绕着如何处理和减轻经济数据的内生性来进行的。 就像医学一样,医学也经常使用类似的方法,但是医学中做的是「真实验」。而在社会科学中,既然没有办法做真实验,那就要构建出仿佛是实验的对照组和控制组,这就是「拟自然实验」的意义。真实的世界我们观察到的,只有一种选择,而经济学家们要做的,就是通过技巧和工具,来构建出一个可信的「如果这件事情没有发生会怎么样」的样本,然后和真实世界的数据进行对比。 差中差(双重差分) 怎么办呢?上面的例子就需要找到一个「出乎意料的事件』来作为「拟自然实验」。比如说美国的国会里议员们经常会针对预算来进行竞争,这种竞争有胜有负,并且是纯粹政治性的,和当地的经济无关。那么这个时候就可以把两个相邻的地区拿来作为对比,其中一个幸运的地区获得了政府投资,而另外一个没有。两个地区其他条件都很相似,那么没有争到这笔钱的,那就是控制组,而议员比较给力的,那就是治疗组了。这个时候,我们就可以比较投资带来的作用了。 怎么做呢? 第一步,先把两个地区都没有获得投资时候的原始经济指标做一个减法,得到的结果就是地区固有的差异; 第二步,等到其中一个地区获得投资后,再把两者的经济指标做一个减法,得到的是新的地区差异; 第三步,把新的地区差异,减去第一步获得的地区固有差异,我们就得到了政策的效果。 图示就是这样的: 灰色线是没有投资的地区,蓝色线是投资的地区。中间的虚线就是蓝线获得投资的时间点。这个就可以明确的看到,当新的区域差异,减去固有的区域差异之后,我们就得到了真实的政策效果。这个方法因为需要减两次,所以称之为差中差(Difference-in-Difference)。 相当于国会议员们巴拉巴拉的辩论了半天,实质上帮助了经济学家做了一个实验——这也是「拟自然实验」得名的原因。 在 David Card(1990)[1]——哦,对了,这位也是今年的诺奖之一,劳动经济学的大拿。从方法论的贡献上,他和 Angrist, Imbens 有明显差距,但是在劳动经济学领域,也做出了很多开创性的贡献,尤其是他的文章里面,广泛的应用了刚才说的『差中差』方法。我下面举的例子就是其中之一: 移民人口对非移民人口工资的影响,这个内生性就很强——往往是高工资的地区,对移民的需求也更高,也愿意给移民更高的工资,这样直接分析的话,可能得到的是一个正相关:非移民的工资越高,移民的工资也越高。并且这个话题在美国也相当的敏感,本地人往往会认为移民抢了他们的工作,尤其是低技能的体力劳动者。 David Card 就想到利用 1980 年 5 月到 9 月的古巴难民事件作为一次拟自然实验。当时在四个月之间,大量的古巴难民因为马列尔事件而涌进了迈阿密,让当地的劳动力供给增加了 7%。 这就是一个天赐良机——马列尔事件是纯政治事件,迈阿密当地的劳动力市场完全不可能对此有任何的预判,而这些人恰恰还大多到了美国之后从事的也就是低技能的体力劳动。 那么这个外生的冲击产生了什么影响呢? 通过这次自然实验,David Card 通过数据分析得出结论:即便是瞬间增加 7%这么大的劳动力冲击,对当地的非移民的失业率和薪酬并没有任何显著影响。这一点就从根本上让削弱了对移民的敌视政策的合理性。并且 David Card 还分析说,因为迈阿密长期以来都有古巴移民的传统,这也是为什么它的短期劳动力市场如此有弹性的原因。 断点回归 Angrist 和 Imbens 的贡献并不仅仅是差中差。在有一些情况下,如果连对照组也找不到怎么办呢? 他们还有办法,那就是「断点回归」。 比如我们想知道,奖学金对一个人未来职业发展的影响。这个如果直接比较也是有问题的——因为奖学金本身不是随便给的,而是给成绩好的人的。那么到底是奖学金在起作用,还是成绩好在起作用呢? 还有大家更加关注的,到底是学校造就了学生,还是学生造就了学校?同一个人上一本和上二本,有很大区别么? 这个也是无法做实验的,我们没办法把一个本来应该上一本的学生随机的分配到二本去,也没办法把不到一本分数线的人随机的提到一本来。无论是实验伦理还是实际情况什么都不允许。 这个时候怎么办呢?就要找确定性里面的随机性,通过这个随机性来构建一个「拟自然实验」。高考的随机性,就是在分数线上下的差距。比如说在一本分数线上下 20 分左右,我们可以认为这些人水平没有太本质的区别,只是因为偶然的发挥而去了不同的学校。 那么这就意味着,在分数线附近,从宏观的角度来看,有一只无形的手,随机的把一些学生分配到了一本和二本。这个拟自然实验构建好了之后,就又可以通过传统的回归分析来推断出因果了。对介绍的这个高考的例子感兴趣的,可以看 Jia and Li (2021)[2], 结论是有显著影响,并且这个影响还不是因为教学质量,而更可能是因为同学之间的社交网络等等所带来的。 我们生活中有很多很多的断点回归,比如说只有 18 岁以下才能享受到一次性教育补助等等,那么 18 岁多一点的,和 18 岁少一点的,就会因为这个优待而产生潜在的不同。这些政策的本意和实验没有关系,但是经济学家们就可以利用这些政策上的「标准线」,而构建出一个又一个的拟自然实验,来研究在表象之下,更深刻的经济学原理。 有了这些方法之后,极大的增加了经济学的实用性和研究范围。可以说,他们的贡献,甚至于超越了经济学这个学科,对社会科学的其他分支,比如政治、社会学、心理学、国际关系等等,都有很大的影响。 阅读原文