Execution-first empirical research system

从数据到可复现实证论文

不只是“上传数据让 AI 写一段报告”。empirical-wizard 把数据理解、codebook 语义、清洗拼接、Stata/Python/R 执行、显著性优化审计、严格保密交付和复现包打包成一条可检查管线。报告中的系数、标准误和 p 值必须来自真实执行产物。

进入实证向导查看方法笔记搜索变量字典

88类实证方法模板

21类规格敏感性候选组

保密实验室席位 / 私有化部署

n3ur0ns.com/wizard/run/analysis

RUN LEDGER

数字金融与企业创新产出

0.154核心系数

0.018p 值

42,806观测值

4交付文件

模型设定与基准回归结果

变量(1)(2)(3)

Digital Finance0.1180.1410.154

Std. Error(0.032)(0.029)(0.026)

Firm FENoYesYes

Year FENoNoYes

每个数字都可回溯；研究数据按账号隔离。

WORKFLOW

把实证流程收束成五个可检查阶段

界面只让研究者确认必要判断；执行层负责把每一步落到日志、CSV、图表和 Word 段落。如果某个方法缺前置条件，系统写出诊断，不把失败包装成成功。

01上传与预检

识别编码、类型、面板结构、缺失码和候选变量。

02变量设计

根据研究问题和 codebook 映射 Y、X、控制变量与识别字段。

03计划确认

确认基准、稳健性、机制、异质性和高级因果识别步骤。

04引擎执行

Stata 为主，Python/R 兜底；所有产物写入隔离作业目录。

05报告打包

生成提交版、内部审计版、规格敏感性版和保密复现包。

WHY NOT ONLY SKILL

Skill 能快速生成步骤，我们把步骤落成可审计证据

只传数据也能启动，是因为系统会用列名、标签、样本值、分布和内置 codebook 做语义推断。但遇到问卷题号、内部编码或跨年口径变化时，系统会要求上传 codebook 或人工确认变量映射，而不是继续猜。

不是自由发挥代码

88 类方法走稳定模板和执行策略；LLM 主要负责研究设计、章节组织和解释，不直接凭空生成关键数字。

codebook 可选但不忽略

内置变量字典能识别 CFPS、CGSS、CHARLS、CSMAR 等常用数据；上传 codebook 后会进入设计、清洗和报告语义。

结果必须可复跑

每一步输出 CSV、日志、代码和审计记录；Word 报告里的表格数字必须能回到执行文件。

显著性优化可披露

默认关闭；启用后只在基准回归后做规格敏感性候选搜索，并记录原始规格、候选、采纳门槛和失败原因。

CONFIDENTIAL OPTIONS

实验室席位和私有化部署分开选择

实验室席位解决多人账号、角色和共享额度；私有化部署解决数据留在指定环境。两者可以叠加，但不是同一个选项。

LAB

实验室席位

PI 统一管理成员、角色、共享额度和组织运行记录，适合导师组、RA 团队和课程项目。

PRIVATE

私有化部署

部署在内网或专属服务器，上传文件、运行日志、中间表、回归结果和报告产物留在指定环境。

AUDIT

共同保密底座

账号隔离、交付可追溯、审计 JSON 和复现说明保留，便于团队内部复核。

管理实验室席位咨询私有化部署查看样例报告

DATA LAYER

数据处理、拼接和清理现在是独立能力层

多文件不是简单 concat。系统会记录输入、键值、行数变化、匹配率、重复键、缺失码、类型转换和清洗后的 lineage，让后续回归知道样本是怎么来的。

STITCH

多文件拼接

支持 append、跨年 harmonize append、aggregate 后 merge、one-to-one / many-to-one 校验、左右键名不同的合并、reshape long/wide。

CLEAN

清洗原子操作

新增批量重命名、键值标准化、显式缺失码转空、类型转换、按键去重；已有缩尾、分组缩尾、异常值、插补和 codebook 清洗规则。

AUDIT

审计与回溯

每个 prepare plan 生成 JSON、JSONL audit、变量 harmonization 表和 lineage；合并膨胀、重复键、未匹配键会被记录或阻断。

rename_columns standardize_keys recode_missing coerce_types drop_duplicates harmonize_append aggregate + merge reshape long / wide IQR / Z-score outlier group-wise winsor mean / median impute codebook cleaning rules

论文不是一段好看的话，而是一条证据链

系统把正式实证论文最容易被追问的部分前置成产品约束：变量定义、模型设定、表格数字、稳健性边界、显著性优化披露、保密交付和复现材料。

数字溯源
正文中出现的 beta、SE、p 值必须来自具名 CSV。

显著性优化可披露
默认关闭；启用后保留原始报告、优化报告和完整候选审计。

模板代码优先
回归代码走预审模板，LLM 只参与研究设计和章节组织。

研究严格保密
数据、运行历史和交付物按账号隔离；私有化部署可完全放在指定环境。

DELIVERABLES

一次运行，四份交付物

面向提交、复核和复现三种场景分别组织内容，避免把内部调参、失败日志、敏感数据说明和教师审阅版混在一起。

DOCX

提交版论文报告

按论文结构组织变量定义、模型设定、描述统计、基准结果、稳健性、扩展分析与结论。

AUDIT

内部审计报告

列出代码审计、规格搜索、失败步骤、方法学风险和下一步建议，供作者和导师复核。

ZIP

保密复现包

打包 .do/.py/.R、CSV、图片、日志和复现说明，在授权范围内回溯每个结果。

METHODS

88 类方法模板，覆盖主流实证论文写法

方法层不是让 AI 临场写代码，而是把常用模型做成稳定模板，并在报告侧加入对应的论文写法、适用前提和诊断边界。

类别	已覆盖方法
基础与诊断	数据清洗、描述统计、相关系数、VIF 共线性、Hausman、残差诊断、基准回归、稳健性、安慰剂、异质性、中介、机制、调节效应。
因果识别	DID、DDD、交错 DID、Sun-Abraham、de Chaisemartin、Borusyak DID imputation、Honest DID、合成控制、Synthetic DID、RDID、Spatial DID、RDD、PSM、IPW、IPWRA、CEM、熵平衡、DML、因果森林。
面板与时序	固定效应、动态面板 system GMM、面板 IV、Hausman-Taylor、Driscoll-Kraay、Newey-West、Conley HAC、面板单位根、Pesaran CD、MG/PMG、VAR、VECM、ARIMA、GARCH、SVAR、HP/BK 滤波、结构断点和 Chow 检验。
模型族	Logit/Probit、多分类/有序选择、Tobit、Heckman、ZIP/ZINB、Poisson/负二项、PPML、分位数/面板分位数、门槛、空间计量、SUR/3SLS、多层混合效应、Oaxaca-Blinder、Meta-analysis、复杂抽样 svy。
问卷与结构模型	Cronbach α、EFA、CFA、Harman 单因素、SEM/路径分析、多重插补、Theil/Gini 不平等分解、局部多项式非参回归、贝叶斯基准回归。

SIGOPT

显著性优化覆盖

替换变量测度、增减控制变量、缩尾/截尾/异常值、固定效应、聚类/HAC/Bootstrap 标准误、滞后与非线性、样本窗口、外生冲击期剔除、模型替换、交互项、动态项、分组/随机半样本、Permutation、Romano-Wolf 和 GMM 候选。

BOUNDARY

不是自动 p-hacking

默认关闭；只在基准回归步骤触发。已达用户阈值会跳过，信号过弱会跳过；采纳结果要经过方向一致、结构合理、审计可解释的门槛。

REPORT

报告写法同步

提交版、内部审计版、规格敏感性版和复现包分开组织。启用优化时会保留原始结果、候选搜索结果和采用/未采用原因。

打开方法笔记查看样例报告

开始跑一个真实研究问题

上传 CSV、DTA 或 XLSX，确认变量设计后即可进入完整实证管线。敏感研究可咨询私有化部署，数据和报告留在指定环境。

进入实证向导