Day 06 · 手写教程
Cronbach α
信度 0.7 不是机械底线
Cronbach α 是什么?
Cronbach α 用来检查一组题项是否稳定地测量同一个概念。比如一个“数字能力”量表里有 6 个问题,alpha 关心的是这些问题之间是否足够一致。它是信度指标,不是效度指标;它不能告诉你量表是否真的测到了理论概念,只能告诉你题项内部是否一致。
这个案例怎么理解?
本页使用财务变量的秩分位派生出 6 个教学题项:roa、lev、size、growth、cashflow、tobinq。这不是正式问卷,而是为了演示信度计算流程。案例派生 alpha 为 0.0409,明显偏低,说明这 6 个变量并不像同一量表题项那样稳定地测量一个共同概念。
正式论文怎么做?
如果是问卷论文,先确认反向题已经倒分,再把同一量表下的题项放进 alpha 命令。输出里不仅看总 alpha,也要看每个题项的 item-rest correlation 和 alpha if item deleted。删题不能只看统计结果,还要看题项是否确实偏离理论概念。
论文里怎么写?
可以写:本文首先对量表题项进行信度检验。若 Cronbach α 达到常用标准,说明题项内部一致性较好,可继续进行因子分析;若 alpha 偏低,则需检查反向题、题项归属或量表设计。本教学案例的 alpha 为 0.0409,因此仅用于演示流程,不作为真实量表结论。
常见错误
不要把 0.7 当成机械生死线。alpha 受题项数量、题项相关和量表维度影响。也不要为了提高 alpha 随意删题;删题必须有理论解释。
本页案例代码和输出
下面这部分是本教程对应的实际案例材料,方便你把前面的解释和真实输出对上。
Stata 代码
import delimited "$DATA_PATH", clear varnames(1) encoding(UTF-8)
gen ln_patent1 = ln(1 + patent_count)
egen firm_id = group(stkcd)
xtset firm_id year
global y ln_patent1
global count_y patent_count
global x dfi_index
global controls roa lev size growth cashflow tobinq top1 dual board indep soe age
gen post = year >= 2018
bysort firm_id: egen pre_dfi = mean(cond(year < 2018, dfi_index, .))
quietly summarize pre_dfi, detail
gen treat = pre_dfi >= r(p50)
gen did = treat * post
gen high_patent = patent_count > 2
gen running_dfi = dfi_index - 260
gen rdd_treat = running_dfi >= 0
alpha roa lev size growth cashflow tobinq, item std
export delimited using "$JOB_DIR/cronbach_alpha_results.csv", replace
输出表
| 指标 | 数值 | 解释 |
|---|---|---|
| 样本 | 1200 obs / 196 firms / 2015-2020 | 来自共用案例 CSV |
| 因变量 | ln(1 + patent_count) | 企业创新产出 |
| 核心解释变量 | dfi_index | 数字普惠金融指数 |
| 输出文件 | cronbach_alpha_results.csv | empirical-wizard 对应方法产物 |
| 案例派生 alpha | 0.0409 | 用财务变量秩分位派生题项 |
| 第一因子解释率 | 0.1876 | Harman 单因素检验最先看的比例 |
| 第二因子解释率 | 0.1719 | EFA 需要同时看多个因子 |
| 题项数 | 6 | roa/lev/size/growth/cashflow/tobinq |
案例图

写作检查
本文使用Cronbach α 信度对案例派生题项进行量表/潜变量诊断。结果见 cronbach_alpha_results.csv。若信度、载荷或拟合指标未达到常用阈值,后续结构路径不宜直接作为强证据解释。
- 确认本页使用的因变量、核心解释变量、控制变量与论文主模型一致。
- 先看表格里的样本口径,再看系数、p 值或诊断指标。
- 代码里的输出文件名要能对应网页展示的结果表。
- 先报告信度/效度,再解释潜变量路径。
- 不要把案例派生题项当成真实问卷结论。