Method 40 · cointegration

Johansen 协整检验

把面板案例聚合成时间维度后演示序列方法

Johansen 协整检验 的 Markdown 风格教程:基于共用 CSMAR 风格案例生成实际代码、结果表和案例图。

返回方法库 · 共用案例 · 变量百科

一、Johansen 协整检验是什么?

这页是 Johansen 协整检验 的方法文档。所有表格和图都由 marketing/method_case_assets/generate_assets.py 从同一份 csmar_innovation_realistic.csv 生成,避免用占位图充当教程。重点是说明如何从面板案例聚合出年度序列,并演示序列模型的最小可复现代码。

二、先看这个案例的结论

  • 年度聚合观测 = 6;面板案例按 year 聚合。
  • ln Patent 年趋势 = 0.0993;年度均值趋势斜率。
  • DFI 年趋势 = 22.3130;数字金融指数年度变化。
  • 这些数字来自页面里的结果表;写论文时先解释数值含义,再讨论理论含义。

三、案例口径

字段口径
数据CSMAR 风格 A 股企业创新面板
原始样本196 家上市公司,2015-2020 年,约 1200 个公司-年观测;各方法有效样本以本页输出表 N 为准
因变量patent_count;回归页通常使用 ln(1 + patent_count)
核心解释变量dfi_index,数字普惠金融指数;部分真实烟测输出展示的是标准化后的 dfi_index
控制变量roa、lev、size、growth、cashflow、tobinq、top1、dual、board、indep、soe、age
输出文件cointegration_results.csv
角色要求dv、iv
依赖包无额外 Stata 社区包要求

四、实际代码

下面是本页对应的最小可复现 Stata 代码。生产环境里 empirical-wizard 会在此基础上处理变量映射、输出校验、失败诊断和报告装配。

import delimited "$DATA_PATH", clear varnames(1) encoding(UTF-8)
gen ln_patent1 = ln(1 + patent_count)
egen firm_id = group(stkcd)
xtset firm_id year

global y ln_patent1
global count_y patent_count
global x dfi_index
global controls roa lev size growth cashflow tobinq top1 dual board indep soe age
gen post = year >= 2018
bysort firm_id: egen pre_dfi = mean(cond(year < 2018, dfi_index, .))
quietly summarize pre_dfi, detail
gen treat = pre_dfi >= r(p50)
gen did = treat * post
gen high_patent = patent_count > 2
gen running_dfi = dfi_index - 260
gen rdd_treat = running_dfi >= 0

collapse (mean) $y $x, by(year)
tsset year
vecrank $y $x, lags(1)
export delimited using "$JOB_DIR/cointegration_results.csv", replace

五、实际输出表

这张表就是本方法页使用的案例输出文件,保存在 marketing/method_case_assets/cointegration/result.csv

指标数值解释
样本1200 obs / 196 firms / 2015-2020来自共用案例 CSV
因变量ln(1 + patent_count)企业创新产出
核心解释变量dfi_index数字普惠金融指数
输出文件cointegration_results.csvempirical-wizard 对应方法产物
年度聚合观测6面板案例按 year 聚合
ln Patent 年趋势0.0993年度均值趋势斜率
DFI 年趋势22.3130数字金融指数年度变化

六、案例图

这是一张由同一份案例数据生成的页面内诊断图。

Johansen 协整检验 的共用案例输出图。
Johansen 协整检验 的共用案例输出图。

七、论文里怎么写

本文将企业面板按年份聚合后使用Johansen 协整检验进行时间序列诊断。结果见 cointegration_results.csv。由于本教学案例年度观测较少,该页重点展示代码和解释框架,正式论文需要更长时间序列。

八、检查清单

  • 确认本页使用的因变量、核心解释变量、控制变量与论文主模型一致。
  • 先看表格里的样本口径,再看系数、p 值或诊断指标。
  • 代码里的输出文件名要能对应网页展示的结果表。
  • 确认时间维度足够长;本教学案例只演示流程。
  • 不要在 6 年年度样本上做过度复杂的动态解释。

返回方法库 · 打开 empirical-wizard