Day 10 · 手写教程

结构方程模型 SEM

不是把回归箭头画得更复杂

返回方法库 · 共用案例 · 变量百科

SEM 是什么?

SEM 是结构方程模型。它把两件事放在一起:第一,潜变量由哪些题项或观测变量测量;第二,这些潜变量之间、潜变量与结果变量之间有什么路径关系。它不是“更高级的回归”,而是一套同时处理测量模型和结构路径的框架。

这个案例怎么读?

本案例把财务状态和治理结构构造成两个教学潜变量,再让它们和 dfi_index 一起解释企业创新。输出显示,finance -> ln Patent 为 0.1266,governance -> ln Patent 为 0.2058,DFI direct path 为 0.0032,模型 R² 为 0.0777。

这几个数的读法是:在这个教学路径模型里,治理和财务潜变量都与创新存在正向路径,DFI 在控制这两个潜变量后仍保留一个很小的直接路径。但这仍然不是自动因果结论,路径方向必须来自理论和研究设计。

实际操作怎么做?

先写测量部分,例如 finance -> roa lev cashflow;再写结构部分,例如 ln_patent1 <- finance governance dfi_index。估计后先看模型是否收敛,再看载荷、路径系数和拟合指标。测量模型不合格时,不要急着解释结构路径。

论文里怎么写?

可以写:本文采用结构方程模型进一步检验财务状态、治理结构与企业创新之间的路径关系。结果显示,财务潜变量和治理潜变量均与创新产出呈正向关系;在纳入上述潜变量后,数字普惠金融指数仍保留正向直接路径。该结果说明路径关系与理论预期基本一致。

常见错误

不要把 SEM 当成因果机器。SEM 里的箭头是研究者根据理论指定的,不是软件自动发现的。也不要跳过 CFA 或测量模型,直接解释结构路径。

本页案例代码和输出

下面这部分是本教程对应的实际案例材料,方便你把前面的解释和真实输出对上。

Stata 代码

import delimited "$DATA_PATH", clear varnames(1) encoding(UTF-8)
gen ln_patent1 = ln(1 + patent_count)
egen firm_id = group(stkcd)
xtset firm_id year

global y ln_patent1
global count_y patent_count
global x dfi_index
global controls roa lev size growth cashflow tobinq top1 dual board indep soe age
gen post = year >= 2018
bysort firm_id: egen pre_dfi = mean(cond(year < 2018, dfi_index, .))
quietly summarize pre_dfi, detail
gen treat = pre_dfi >= r(p50)
gen did = treat * post
gen high_patent = patent_count > 2
gen running_dfi = dfi_index - 260
gen rdd_treat = running_dfi >= 0

sem (finance -> roa lev cashflow) (governance -> top1 indep board) ($y <- finance governance $x)
estat gof, stats(all)
export delimited using "$JOB_DIR/sem_results.csv", replace

输出表

指标数值解释
样本1200 obs / 196 firms / 2015-2020来自共用案例 CSV
因变量ln(1 + patent_count)企业创新产出
核心解释变量dfi_index数字普惠金融指数
输出文件sem_results.csvempirical-wizard 对应方法产物
finance -> ln Patent0.1266由 ROA/Cashflow/TobinQ/Lev 派生的财务潜变量路径
governance -> ln Patent0.2058由 Top1/Indep/Board 派生的治理潜变量路径
DFI direct path0.0032控制两个潜变量后的直接路径
模型 R²0.0777教学路径模型的解释度

案例图

结构方程 SEM / 路径分析 的共用案例输出图。
结构方程 SEM / 路径分析 的共用案例输出图。

写作检查

本文使用结构方程 SEM / 路径分析对案例派生题项进行量表/潜变量诊断。结果见 sem_results.csv。若信度、载荷或拟合指标未达到常用阈值,后续结构路径不宜直接作为强证据解释。

  • 确认本页使用的因变量、核心解释变量、控制变量与论文主模型一致。
  • 先看表格里的样本口径,再看系数、p 值或诊断指标。
  • 代码里的输出文件名要能对应网页展示的结果表。
  • 先报告信度/效度,再解释潜变量路径。
  • 不要把案例派生题项当成真实问卷结论。

返回方法库 · 打开 empirical-wizard