间断点回归的经济学应用

[ 下载 ]

摘要：间断点回归（RD）是仅次于随机实验的，能够有效利用现实约束条件分析变量之间因果关系的实证方法。

本文旨在简要介绍间断点回归，并对一些问题予以解释。

下载论文网　　关键词：间断点回归；处理效应；有效性　　中图分类号：F224 文献识别码：A 文章编号：1001—828X（2016）010—000—01 　　一、简介　　间断点回归（也成RD）首次被在Thistlethwaite和Campbell（1960）用于在准自然实验中评估处理效应，实验准则便是参与实验的某一样本（也可称为强制变量）是否超过了既定的“间断点”。

该评估策略尽管已有五十多年历史，但直到最近才被引入经济学中使用。

自从教育领域运用RD逐渐成熟后，之后涌现一大批运用此方法研究各种问题的文献。

Hahn Jinyong，Petra Todd和Wilbert van der Klaauw（2001）认为RD相比于其他准实验的需要的假设更为宽泛并且为RD的使用建立了规范。

RD兴起的另一个原因在于它不仅仅是效用评估的方法，基于RD的因果推论也比其他传统的自然实验更为可信（双重差分法和工具变量法），因此被更多的应用在应用研究领域。

因此，为了提供一个具有高可信度和透明的项目效应评估方法，RD能够被用于分析许多重要经济学问题。

尽管RD在经济学中的地位日渐重要，始终没有对于如何理解RD的总结的文献，以及对RD的优缺点评判的文献。

另外，对于使用RD的具体细节步骤也尚未涵盖标准的计量经济学检验。

撰写本文的目的便在于弥补上述的不足，把RD在经济学中使用的一些要求明确出来，给予对此方法感兴趣的学者以引导。

二、如果样本能够准确的改变所赋值的变量，那么RD便是无效的　　当接受处理会获得奖励或收益时，经济学家自然会想要知道该个体会如何表现进而得到奖励。

比如，学生通过努力有效“提高”自己的测试成绩。

得分为c的样本应该比起得分低于c的样本来说应该不同。

这就告诉我们，处理的存在就好比赋值变量的函数为不连续函数，但仅仅有这一点并不能够分辨RD是否合理。

因此，任何产生激励进行为的间断规则都能导致RD无效。

三、如果个体不能够准确改变赋值变量，实验中处理的变化在临界值附近可以视为和通过随机实验得到的结果是一样的　　这也是RD其如此被追捧的原因。

当个体不能准确的控制赋值变量时，尤其在临界附近的X的值，每个样本大致上得到略高于（处理）或略低于（不处理）临界值的概率，可以看做抛硬币实验的翻版。

这也区别了RD和工具变量法的不同。

当使用工具变量法分析因果推论，必须假设工具变量的选择是外生决定的（比如通过掷硬币决定），但这一点很难区分。

相反，在假设样本不能准确控制赋值变量的前提下，RD所隔离的变化和随机试验得到的效果是一样的。

四、和随机试验一样，RD也能被分析以及检验　　这也是局部随机结果的一个关键内涵。

如果在临界点附近，处理的差异大致上随机的，所有变量的确定先于赋值变量的识别，略高或略低于临界值的变量应具有相同的分布，则服从所有“基准特征”。

如果这些基线协变量中存在间断点，基础的识别假设“样本不能准确控制赋值变量”就显得毫无依据。

因此，常常用基线协变量来测试RD是否合理有效。

对比之下，在选择工具变量和匹配或回归控制策略时，需要设定有关处理的协变量和结果变量之间关系的假设条件。

五、RD的图形表达是有帮助的，但图像不应以是否有效标示　　用坐标图分析RD中赋值变量与结果变量的关系已成为标准做法。

这确实有一定的优势，因为原始数据会增加研究的透明度。

图示法会直白告诉读者，相比于回归曲线远离临界点凸起的部分，结果变量在临界处的跳跃是否更加明显。

另外，图形展示会帮助解释为什么不同的函数形式会得到不同的答案，而且能够识别出实证分析中存在一个问题，即极端值的存在问题。

对于图示法的一个问题便是，学者会去构造看起来有效果的图形，或者有意掩盖实际存在的效应。

六、非参数估计并不是解决由RD产生的函数形式问题的方法。

对于非参数估计，我们有必要将其看作是参数估计的补充而不是替代　　当学者选择参数函数形式是错误的，回归结果通常是有偏的。

而采用非参数程序，比如局部线性回归，仅仅对临界值附近的样本点做回归得到的结果同样是有偏的（除非选取的区域为真实线性存在的）。

对于确定函数的形式，有可能低阶多项式是很好的近似表达，带来偏误很小甚至是无偏的。

但在其他情况下，多项式的形式或许不是好的近似表达，而采用局部线性回归会得到更小的偏误。

举例来说，讨论结果Y对X和处理虚拟变量D做回归，既可被看作是参数回归也可以是宽带宽的局部线性回归。

因此我们建议不要仅依赖一种方式。

在实证分析环节，由两种同样可信的设定的方法所得出的结果更加稳定，且比对设定轻微变动敏感的结果更加可靠。

RD构思对此也不例外。

七、拟合优度和其他统计检验能帮助排除苛刻的设定　　通常采用不同规则导致估计结果取值范围更宽。

虽然不存在某个方程形式适用于所有情形且能除去不合适的设定，该说法似合乎情理。

至少我们应认为，不要依赖于设定一旦更灵活便会被拒绝的设定得出的估计结果。

举例说明，当结果来于低阶多项式模型，因为更少限制的（区分每个离散变量X的均值）而被拒绝，对于这种结果我们给予小可信度是合理的。

同样的，没有理由使我们更青睐于对所有数据采用同一设定的情况。

但限制仅选择临界值附近的观测值会给出实质上且统计上不同的答案。

总之，RD更应该被看作是一种特殊的数据产生过程的描述。

为研究某一事物我们青睐于随机试验或是RD得出的数据。

但事实是，和随机试验一样（被看做是具体的数据产生方式更加合适而不是研究分析的方法），RD的存在不是在于回答一系列问题。

这就是说，会涌现出一股潮流来揭示RD会涉及更多经济学领域中。

参考文献：　　[1] Thistleth waite，Donald L.，and Donald T. Campbell， “Regression—Discontinuity Analysis： An Alternative to the Ex Post Facto Experiment”，Journal of Educational Psychology，51（6），1960. 　　[2] Hahn Jinyong，Petra Todd，Wilbert van der Klaauw， “Evaluating the Effect of An Antidiscrimination Law Using a Regression Discontinuity Design”NBER Working paper 7131.

4 次访问