Method 59 · ppml

PPML 引力方程

因变量不是连续正态时,不再硬套 OLS

PPML 引力方程 的 Markdown 风格教程:基于共用 CSMAR 风格案例生成实际代码、结果表和案例图。

返回方法库 · 共用案例 · 变量百科

一、PPML 引力方程是什么?

这页是 PPML 引力方程 的方法文档。所有表格和图都由 marketing/method_case_assets/generate_assets.py 从同一份 csmar_innovation_realistic.csv 生成,避免用占位图充当教程。重点是根据因变量类型切换模型,并把非线性系数和边际效应分开理解。

二、先看这个案例的结论

  • 状态 = ppmlhdfe 失败 (需 ssc install ppmlhdfe) rc=198。
  • 这些数字来自页面里的结果表;写论文时先解释数值含义,再讨论理论含义。

三、案例口径

字段口径
数据CSMAR 风格 A 股企业创新面板
原始样本196 家上市公司,2015-2020 年,约 1200 个公司-年观测;各方法有效样本以本页输出表 N 为准
因变量patent_count;回归页通常使用 ln(1 + patent_count)
核心解释变量dfi_index,数字普惠金融指数;部分真实烟测输出展示的是标准化后的 dfi_index
控制变量roa、lev、size、growth、cashflow、tobinq、top1、dual、board、indep、soe、age
输出文件ppml_results.csv
角色要求dv、iv
依赖包ppmlhdfe

四、实际代码

下面是本页对应的最小可复现 Stata 代码。生产环境里 empirical-wizard 会在此基础上处理变量映射、输出校验、失败诊断和报告装配。

log using "/root/workspace/empirical-wizard/workspace/70a328eb/analysis.log", replace text
global JOB_DIR "/root/workspace/empirical-wizard/workspace/70a328eb"
set more off
adopath + "/root/ado/plus"
global DATA_PATH "/root/workspace/empirical-wizard/workspace/test_e2e/csmar_innovation.csv"
import delimited "/root/workspace/empirical-wizard/workspace/test_e2e/csmar_innovation.csv", clear case(preserve)
capture confirm global JOB_DIR
if _rc global JOB_DIR "."
quietly duplicates drop
* ── PPML (Poisson 伪极大似然,引力方程/非负计数) ──
capture noisily ppmlhdfe patent_count dfi_index roa lev size growth cashflow tobinq top1 dual board indep soe age, absorb(stkcd year), cluster(stkcd)
local _rc = _rc
tempname fh
capture file close `fh'
file open `fh' using "$JOB_DIR/ppml_results.csv", write replace
file write `fh' "项目,值" _n
file write `fh' "因变量,patent_count" _n
if `_rc' == 0 {
    capture local _b : display %9.4f _b[dfi_index]
    capture local _se : display %9.4f _se[dfi_index]
    capture local _n = e(N)
    capture local _r2 : display %9.4f e(r2_p)
    file write `fh' "核心系数 (semi-elasticity),`_b'" _n
    file write `fh' "标准误,`_se'" _n
    file write `fh' "Pseudo R²,`_r2'" _n
    file write `fh' "样本量,`_n'" _n
}
else file write `fh' "状态,ppmlhdfe 失败 (需 ssc install ppmlhdfe) rc=`_rc'" _n
file close `fh'
di "PPML 完成"
log close

五、实际输出表

这张表就是本方法页使用的案例输出文件,保存在 marketing/method_case_assets/ppml/result.csv

项目
因变量patent_count
状态ppmlhdfe 失败 (需 ssc install ppmlhdfe) rc=198

六、案例图

这是一张由同一份案例数据生成的页面内诊断图。

PPML 引力方程 的共用案例输出图。
PPML 引力方程 的共用案例输出图。

七、论文里怎么写

本文在共用企业面板样本上报告PPML 引力方程,核心输出见 ppml_results.csv。结果解释时同时关注样本口径、变量构造、系数方向、标准误和适用前提,避免只凭单个 p 值完成方法选择。

八、检查清单

  • 确认本页使用的因变量、核心解释变量、控制变量与论文主模型一致。
  • 先看表格里的样本口径,再看系数、p 值或诊断指标。
  • 代码里的输出文件名要能对应网页展示的结果表。
  • 确认因变量类型和模型假设匹配。
  • Logit/Poisson 等模型要区分系数、发生比和边际效应。

返回方法库 · 打开 empirical-wizard