empirical methods · tutorials

实证方法笔记

用同一份 CSMAR 风格企业面板,把实证方法整理成可复现教程。Day01-Day10 已改成逐篇手写正文,不再用统一模板套内容;其余方法页先保留案例材料,后续逐篇补齐。

看本系列共用案例 · 查变量百科

本系列共用案例

全系列 88 讲共用同一份案例数据:196 家 A 股上市公司 × 2015-2020 年面板,因变量企业当年发明专利计数 Patent,核心解释变量北大数字普惠金融指数 DFI,10 个常用控制变量。从 Day 01 描统一直串到 Day 55 DID。 每一篇教程都从这份数据或它的明确派生变量生成结果表和图片,不用模板占位符。 看完整案例说明 →

教程列表

当前已挂载 88 个方法页,其中 10 篇是手写教程。

编号方法分组状态输出文件
Method 01数据清洗
先把数据质量和变量关系讲清楚
数据体检案例材料data_cleaning_step_summary.csv
Day 01描述性统计
第一张表不是凑数,是数据可信度体检
first table手写教程描述性统计.csv
Day 02相关性矩阵
Pearson 不等于相关性的全部
diagnostics手写教程相关系数矩阵.csv
Day 03多重共线性 VIF
VIF<10 不等于万事大吉
diagnostics手写教程vif_results.csv
Day 04Hausman 检验
FE 还是 RE,不只是看 p 值
panel data手写教程hausman_test.csv
Method 06残差诊断检验
先把数据质量和变量关系讲清楚
数据体检案例材料diagnostics.csv
Method 07基准回归
用同一份企业面板跑出可解释的模型证据
面板与回归案例材料regression_table_基准回归.csv
Method 08稳健性检验
用同一份企业面板跑出可解释的模型证据
面板与回归案例材料regression_table_稳健性检验.csv
Method 09安慰剂检验
用同一份企业面板跑出可解释的模型证据
面板与回归案例材料regression_table_稳健性检验.csv
Method 10异质性分析
用同一份企业面板跑出可解释的模型证据
面板与回归案例材料regression_table_异质性检验.csv
Method 11中介效应
把作用路径、调节项和异质性拆开看
机制与异质性案例材料mediation_results.csv
Method 12机制分析
把作用路径、调节项和异质性拆开看
机制与异质性案例材料mechanism_feasibility.csv
Method 13调节效应
把作用路径、调节项和异质性拆开看
机制与异质性案例材料moderation_results.csv
Method 14内生性处理
把内生性、稳健性和标准误问题说清楚
内生性与稳健性案例材料endogeneity_iv.csv
Method 15PSM 倾向得分匹配
把处理组、对照组和政策时点落到代码里
政策评估案例材料psm_results.csv
Method 16DID 双重差分
把处理组、对照组和政策时点落到代码里
政策评估案例材料did_results.csv
Method 17Callaway-Sant'Anna 交错 DID
把处理组、对照组和政策时点落到代码里
政策评估案例材料csdid_results.csv
Method 18二元选择 Logit/Probit
因变量不是连续正态时,不再硬套 OLS
离散/受限因变量案例材料regression_table_logit.csv
Method 19生存分析 Cox/KM
因变量不是连续正态时,不再硬套 OLS
离散/受限因变量案例材料stcox_results.csv
Method 20三重差分 DDD
把处理组、对照组和政策时点落到代码里
政策评估案例材料ddd_results.csv
Method 21合成控制法
把处理组、对照组和政策时点落到代码里
政策评估案例材料synth_results.csv
Method 22Sun-Abraham 事件研究
把处理组、对照组和政策时点落到代码里
政策评估案例材料sa_eventstudy_results.csv
Method 23de Chaisemartin DID
把处理组、对照组和政策时点落到代码里
政策评估案例材料dcdh_did_results.csv
Method 24Honest DID 敏感性
把处理组、对照组和政策时点落到代码里
政策评估案例材料honest_did_results.csv
Method 25Oster 系数稳定性边界
把内生性、稳健性和标准误问题说清楚
内生性与稳健性案例材料oster_bound_results.csv
Method 26Romano-Wolf 多重检验校正
把内生性、稳健性和标准误问题说清楚
内生性与稳健性案例材料rwolf_results.csv
Method 27Bartik / shift-share IV
把内生性、稳健性和标准误问题说清楚
内生性与稳健性案例材料bartik_results.csv
Method 28Conley 空间 HAC SE
把内生性、稳健性和标准误问题说清楚
内生性与稳健性案例材料conley_hac_results.csv
Method 29Heckman 样本选择
因变量不是连续正态时,不再硬套 OLS
离散/受限因变量案例材料heckman_results.csv
Method 30Tobit 审查回归
因变量不是连续正态时,不再硬套 OLS
离散/受限因变量案例材料tobit_results.csv
Method 31多分类/有序选择
因变量不是连续正态时,不再硬套 OLS
离散/受限因变量案例材料categorical_results.csv
Method 32ZIP / ZINB 计数模型
因变量不是连续正态时,不再硬套 OLS
离散/受限因变量案例材料zip_zinb_results.csv
Method 33RDD 断点回归
看均值之外的门槛、分位数和局部变化
非线性与非参数案例材料rdd_results.csv
Method 34分位数回归
看均值之外的门槛、分位数和局部变化
非线性与非参数案例材料quantile_results.csv
Method 35门槛效应
看均值之外的门槛、分位数和局部变化
非线性与非参数案例材料threshold_results.csv
Method 36空间计量
看均值之外的门槛、分位数和局部变化
非线性与非参数案例材料spatial_results.csv
Method 37动态面板 system GMM
看均值之外的门槛、分位数和局部变化
非线性与非参数案例材料gmm_dynamic_results.csv
Method 38DML / Post-double-selection LASSO
把作用路径、调节项和异质性拆开看
机制与异质性案例材料dml_results.csv
Method 39单位根检验 ADF/PP/KPSS
把面板案例聚合成时间维度后演示序列方法
时间序列案例材料unit_root_results.csv
Method 40Johansen 协整检验
把面板案例聚合成时间维度后演示序列方法
时间序列案例材料cointegration_results.csv
Method 41VAR + Granger 因果
把面板案例聚合成时间维度后演示序列方法
时间序列案例材料var_results.csv
Method 42VECM 向量误差修正
把面板案例聚合成时间维度后演示序列方法
时间序列案例材料vecm_results.csv
Method 43ARIMA 时间序列
把面板案例聚合成时间维度后演示序列方法
时间序列案例材料arima_results.csv
Method 44GARCH 波动率模型
把面板案例聚合成时间维度后演示序列方法
时间序列案例材料garch_results.csv
Method 45Entropy Balancing 熵平衡
把处理组、对照组和政策时点落到代码里
政策评估案例材料ebalance_results.csv
Method 46CEM 粗精确匹配
把处理组、对照组和政策时点落到代码里
政策评估案例材料cem_results.csv
Method 47IPW 逆概率加权
把处理组、对照组和政策时点落到代码里
政策评估案例材料ipw_results.csv
Method 48Driscoll-Kraay 标准误
用同一份企业面板跑出可解释的模型证据
面板与回归案例材料driscoll_kraay_results.csv
Method 49Newey-West HAC SE
把面板案例聚合成时间维度后演示序列方法
时间序列案例材料newey_west_results.csv
Method 50弱工具变量诊断
把内生性、稳健性和标准误问题说清楚
内生性与稳健性案例材料weak_iv_results.csv
Method 51面板单位根 LLC/IPS/Fisher
把面板案例聚合成时间维度后演示序列方法
时间序列案例材料panel_unit_root_results.csv
Method 52Pesaran 截面相关性 CD
把面板案例聚合成时间维度后演示序列方法
时间序列案例材料pesaran_cd_results.csv
Method 53Mean Group / PMG 异质面板
把面板案例聚合成时间维度后演示序列方法
时间序列案例材料mg_pmg_results.csv
Method 54似不相关回归 SUR / 3SLS
把不常见但论文里会遇到的模型跑成可检查输出
其他模型案例材料sur_results.csv
Method 55Meta-analysis 元分析
把不常见但论文里会遇到的模型跑成可检查输出
其他模型案例材料meta_results.csv
Method 56复杂抽样 svy
把不常见但论文里会遇到的模型跑成可检查输出
其他模型案例材料svy_results.csv
Method 57Lewbel 异方差识别 IV
把内生性、稳健性和标准误问题说清楚
内生性与稳健性案例材料lewbel_results.csv
Method 58Synthetic DID
把处理组、对照组和政策时点落到代码里
政策评估案例材料sdid_results.csv
Method 59PPML 引力方程
因变量不是连续正态时,不再硬套 OLS
离散/受限因变量案例材料ppml_results.csv
Method 60Poisson / 负二项计数
因变量不是连续正态时,不再硬套 OLS
离散/受限因变量案例材料poisson_nb_results.csv
Method 61多层混合效应模型
看均值之外的门槛、分位数和局部变化
非线性与非参数案例材料mixed_results.csv
Method 62Oaxaca-Blinder 分解
把作用路径、调节项和异质性拆开看
机制与异质性案例材料oaxaca_results.csv
Method 63Wild Cluster Bootstrap
把内生性、稳健性和标准误问题说清楚
内生性与稳健性案例材料boottest_results.csv
Method 64FGLS 面板 (异方差+AR1)
用同一份企业面板跑出可解释的模型证据
面板与回归案例材料xtgls_results.csv
Method 65Borusyak DID Imputation
把处理组、对照组和政策时点落到代码里
政策评估案例材料did_imputation_results.csv
Day 06Cronbach α
信度 0.7 不是机械底线
scale reliability手写教程cronbach_alpha_results.csv
Day 08探索性因子分析 EFA
不是几个题随便装一个因子
factor analysis手写教程efa_results.csv
Day 07Harman 单因子检验
共同方法偏差不是三分钟就能彻底搞定
common method bias手写教程harman_results.csv
Method 69多重插补 + 合成估计
把不常见但论文里会遇到的模型跑成可检查输出
其他模型案例材料mi_impute_results.csv
Method 70面板 IV (xtivreg)
把内生性、稳健性和标准误问题说清楚
内生性与稳健性案例材料xtivreg_results.csv
Method 71Hausman-Taylor 估计
用同一份企业面板跑出可解释的模型证据
面板与回归案例材料xthtaylor_results.csv
Method 72Interrupted Time Series 政策评估
把面板案例聚合成时间维度后演示序列方法
时间序列案例材料its_results.csv
Method 73IPWRA 双重稳健 ATET
把处理组、对照组和政策时点落到代码里
政策评估案例材料dr_ipwra_results.csv
Day 10结构方程模型 SEM
不是把回归箭头画得更复杂
structural equation modeling手写教程sem_results.csv
Method 75截断回归 truncreg
因变量不是连续正态时,不再硬套 OLS
离散/受限因变量案例材料truncreg_results.csv
Method 76面板分位数回归
看均值之外的门槛、分位数和局部变化
非线性与非参数案例材料xtqreg_results.csv
Method 77Theil / Gini 不平等分解
把不常见但论文里会遇到的模型跑成可检查输出
其他模型案例材料theil_gini_results.csv
Method 78条件 Logit + 随机效应
因变量不是连续正态时,不再硬套 OLS
离散/受限因变量案例材料clogit_results.csv
Method 79结构断点检验
把面板案例聚合成时间维度后演示序列方法
时间序列案例材料structural_break_results.csv
Method 80局部多项式非参回归
看均值之外的门槛、分位数和局部变化
非线性与非参数案例材料lpoly_results.csv
Day 09验证性因子分析 CFA
拟合指数不是凑够几个就行
measurement model手写教程cfa_results.csv
Method 82贝叶斯基准回归
把不常见但论文里会遇到的模型跑成可检查输出
其他模型案例材料bayes_baseline_results.csv
Method 83结构 VAR + IRF/FEVD
把面板案例聚合成时间维度后演示序列方法
时间序列案例材料svar_results.csv
Method 84HP / Baxter-King 滤波
把面板案例聚合成时间维度后演示序列方法
时间序列案例材料hp_filter_results.csv
Day 05Chow 检验
两组系数看着不一样,不等于真的有差
heterogeneity手写教程chow_test_results.csv
Method 86RDID 断点 × DID
把处理组、对照组和政策时点落到代码里
政策评估案例材料rdid_results.csv
Method 87Spatial DID 空间溢出 DID
把处理组、对照组和政策时点落到代码里
政策评估案例材料spdid_results.csv
Method 88Causal Forest (grf) 因果森林
把作用路径、调节项和异质性拆开看
机制与异质性案例材料causal_forest_results.csv