Execution-first empirical research system

从数据到可复现实证论文

不只是“上传数据让 AI 写一段报告”。empirical-wizard 把数据理解、codebook 语义、清洗拼接、Stata/Python/R 执行、 显著性优化审计、严格保密交付和复现包打包成一条可检查管线。报告中的系数、标准误和 p 值必须来自真实执行产物。

88类实证方法模板
21类规格敏感性候选组
保密实验室席位 / 私有化部署

把实证流程收束成五个可检查阶段

界面只让研究者确认必要判断;执行层负责把每一步落到日志、CSV、图表和 Word 段落。 如果某个方法缺前置条件,系统写出诊断,不把失败包装成成功。

01上传与预检

识别编码、类型、面板结构、缺失码和候选变量。

02变量设计

根据研究问题和 codebook 映射 Y、X、控制变量与识别字段。

03计划确认

确认基准、稳健性、机制、异质性和高级因果识别步骤。

04引擎执行

Stata 为主,Python/R 兜底;所有产物写入隔离作业目录。

05报告打包

生成提交版、内部审计版、规格敏感性版和保密复现包。

Skill 能快速生成步骤,我们把步骤落成可审计证据

只传数据也能启动,是因为系统会用列名、标签、样本值、分布和内置 codebook 做语义推断。 但遇到问卷题号、内部编码或跨年口径变化时,系统会要求上传 codebook 或人工确认变量映射,而不是继续猜。

01

不是自由发挥代码

88 类方法走稳定模板和执行策略;LLM 主要负责研究设计、章节组织和解释,不直接凭空生成关键数字。

02

codebook 可选但不忽略

内置变量字典能识别 CFPS、CGSS、CHARLS、CSMAR 等常用数据;上传 codebook 后会进入设计、清洗和报告语义。

03

结果必须可复跑

每一步输出 CSV、日志、代码和审计记录;Word 报告里的表格数字必须能回到执行文件。

04

显著性优化可披露

默认关闭;启用后只在基准回归后做规格敏感性候选搜索,并记录原始规格、候选、采纳门槛和失败原因。

实验室席位和私有化部署分开选择

实验室席位解决多人账号、角色和共享额度;私有化部署解决数据留在指定环境。两者可以叠加,但不是同一个选项。

LAB

实验室席位

PI 统一管理成员、角色、共享额度和组织运行记录,适合导师组、RA 团队和课程项目。

PRIVATE

私有化部署

部署在内网或专属服务器,上传文件、运行日志、中间表、回归结果和报告产物留在指定环境。

AUDIT

共同保密底座

账号隔离、交付可追溯、审计 JSON 和复现说明保留,便于团队内部复核。

数据处理、拼接和清理现在是独立能力层

多文件不是简单 concat。系统会记录输入、键值、行数变化、匹配率、重复键、缺失码、类型转换和清洗后的 lineage, 让后续回归知道样本是怎么来的。

STITCH

多文件拼接

支持 append、跨年 harmonize append、aggregate 后 merge、one-to-one / many-to-one 校验、左右键名不同的合并、reshape long/wide。

CLEAN

清洗原子操作

新增批量重命名、键值标准化、显式缺失码转空、类型转换、按键去重;已有缩尾、分组缩尾、异常值、插补和 codebook 清洗规则。

AUDIT

审计与回溯

每个 prepare plan 生成 JSON、JSONL audit、变量 harmonization 表和 lineage;合并膨胀、重复键、未匹配键会被记录或阻断。

rename_columns standardize_keys recode_missing coerce_types drop_duplicates harmonize_append aggregate + merge reshape long / wide IQR / Z-score outlier group-wise winsor mean / median impute codebook cleaning rules

论文不是一段好看的话,而是一条证据链

系统把正式实证论文最容易被追问的部分前置成产品约束:变量定义、模型设定、表格数字、稳健性边界、显著性优化披露、保密交付和复现材料。

1
数字溯源
正文中出现的 beta、SE、p 值必须来自具名 CSV。
2
显著性优化可披露
默认关闭;启用后保留原始报告、优化报告和完整候选审计。
3
模板代码优先
回归代码走预审模板,LLM 只参与研究设计和章节组织。
4
研究严格保密
数据、运行历史和交付物按账号隔离;私有化部署可完全放在指定环境。

一次运行,四份交付物

面向提交、复核和复现三种场景分别组织内容,避免把内部调参、失败日志、敏感数据说明和教师审阅版混在一起。

DOCX

提交版论文报告

按论文结构组织变量定义、模型设定、描述统计、基准结果、稳健性、扩展分析与结论。

AUDIT

内部审计报告

列出代码审计、规格搜索、失败步骤、方法学风险和下一步建议,供作者和导师复核。

ZIP

保密复现包

打包 .do/.py/.R、CSV、图片、日志和复现说明,在授权范围内回溯每个结果。

88 类方法模板,覆盖主流实证论文写法

方法层不是让 AI 临场写代码,而是把常用模型做成稳定模板,并在报告侧加入对应的论文写法、适用前提和诊断边界。

类别已覆盖方法
基础与诊断数据清洗、描述统计、相关系数、VIF 共线性、Hausman、残差诊断、基准回归、稳健性、安慰剂、异质性、中介、机制、调节效应。
因果识别DID、DDD、交错 DID、Sun-Abraham、de Chaisemartin、Borusyak DID imputation、Honest DID、合成控制、Synthetic DID、RDID、Spatial DID、RDD、PSM、IPW、IPWRA、CEM、熵平衡、DML、因果森林。
面板与时序固定效应、动态面板 system GMM、面板 IV、Hausman-Taylor、Driscoll-Kraay、Newey-West、Conley HAC、面板单位根、Pesaran CD、MG/PMG、VAR、VECM、ARIMA、GARCH、SVAR、HP/BK 滤波、结构断点和 Chow 检验。
模型族Logit/Probit、多分类/有序选择、Tobit、Heckman、ZIP/ZINB、Poisson/负二项、PPML、分位数/面板分位数、门槛、空间计量、SUR/3SLS、多层混合效应、Oaxaca-Blinder、Meta-analysis、复杂抽样 svy。
问卷与结构模型Cronbach α、EFA、CFA、Harman 单因素、SEM/路径分析、多重插补、Theil/Gini 不平等分解、局部多项式非参回归、贝叶斯基准回归。
SIGOPT

显著性优化覆盖

替换变量测度、增减控制变量、缩尾/截尾/异常值、固定效应、聚类/HAC/Bootstrap 标准误、滞后与非线性、样本窗口、外生冲击期剔除、模型替换、交互项、动态项、分组/随机半样本、Permutation、Romano-Wolf 和 GMM 候选。

BOUNDARY

不是自动 p-hacking

默认关闭;只在基准回归步骤触发。已达用户阈值会跳过,信号过弱会跳过;采纳结果要经过方向一致、结构合理、审计可解释的门槛。

REPORT

报告写法同步

提交版、内部审计版、规格敏感性版和复现包分开组织。启用优化时会保留原始结果、候选搜索结果和采用/未采用原因。

开始跑一个真实研究问题

上传 CSV、DTA 或 XLSX,确认变量设计后即可进入完整实证管线。敏感研究可咨询私有化部署,数据和报告留在指定环境。

进入实证向导