Permutation 随机化推断 · empirical-wizard methods

Permutation 随机化推断是什么？

Permutation inference 问的是：如果核心变量或处理标签只是随机分配，真实估计量还会这么极端吗。它固定主模型，只改变标签，用随机标签世界构造零假设分布。

把置换推断想成反复洗牌。模型、样本和控制变量都不变，只把处理标签打乱；如果真实系数在这些洗牌结果里非常罕见，说明它不太像随机标签造成的。

判断项	教科书式判断
适合用在	样本较小、常规分布近似可疑，或希望检验处理标签随机性。
先不要用在	主模型本身还没固定，或每次置换都会改变样本定义。
最关键的前提	置换规则要符合研究设计，例如在可交换的单位或聚类内置换。
读表顺序	真实系数、常规 p 值、有效置换次数、经验 p 值。
论文表述边界	经验 p 值来自随机标签世界，不等同于常规模型 p 值。

双侧置换 p 值常写成：

p_{perm}=\frac{1+\sum_{b=1}^{B}1(|\hat{\beta}_b^*|\ge |\hat{\beta}|)}{1+B}

加 1 是常见的小样本修正，避免经验 p 值被写成绝对零。

置换推断的专业性在于“固定主模型”和“诚实报告有效置换次数”。

口径	专业写法
模型固定	因变量、控制变量、固定效应和标准误口径都不应在置换中改变。
置换对象	说明置换的是处理标签、核心解释变量还是聚类层标签。
有效次数	报告成功估计的置换次数，不只报告计划次数。
经验 p 值	同时报告真实常规 p 和 permutation p，二者含义不同。

字段	口径
数据	CSMAR 风格 A 股企业创新面板
原始样本	196 家上市公司，2015-2020 年，约 1200 个公司-年观测；各方法有效样本以本页输出表 N 为准
因变量	patent_count；回归页通常使用 ln(1 + patent_count)
核心解释变量	dfi_index，数字普惠金融指数；部分案例输出展示的是标准化后的 dfi_index
控制变量	roa、lev、size、growth、cashflow、tobinq、top1、dual、board、indep、soe、age
输出文件	permutation_inference_results.csv
角色要求	因变量、核心解释变量
依赖包	无额外 Stata 社区包要求

下面是本页案例里的最小 Stata 代码。它的作用是帮助你看清变量怎么进入模型、结果文件怎么生成，而不是要求你在网页里手动运行。

* case code has not been generated yet

这张表是本方法页配套案例的输出结果，用来把前面的公式、变量口径和代码对应到实际数字。

该方法的案例输出表还没有生成。

这是一张由同一份案例数据生成的页面内诊断图。

为缓解模型设定或内生性担忧，本文补充报告Permutation 随机化推断。相关估计输出见 permutation_inference_results.csv。该检验不替代研究设计本身，但可以说明核心结论在替代识别、标准误或稳健性口径下是否保持一致。