不是自由发挥代码
88 类方法走稳定模板和执行策略;LLM 主要负责研究设计、章节组织和解释,不直接凭空生成关键数字。
界面只让研究者确认必要判断;执行层负责把每一步落到日志、CSV、图表和 Word 段落。 如果某个方法缺前置条件,系统写出诊断,不把失败包装成成功。
识别编码、类型、面板结构、缺失码和候选变量。
根据研究问题和 codebook 映射 Y、X、控制变量与识别字段。
确认基准、稳健性、机制、异质性和高级因果识别步骤。
Stata 为主,Python/R 兜底;所有产物写入隔离作业目录。
生成提交版、内部审计版、规格敏感性版和保密复现包。
只传数据也能启动,是因为系统会用列名、标签、样本值、分布和内置 codebook 做语义推断。 但遇到问卷题号、内部编码或跨年口径变化时,系统会要求上传 codebook 或人工确认变量映射,而不是继续猜。
88 类方法走稳定模板和执行策略;LLM 主要负责研究设计、章节组织和解释,不直接凭空生成关键数字。
内置变量字典能识别 CFPS、CGSS、CHARLS、CSMAR 等常用数据;上传 codebook 后会进入设计、清洗和报告语义。
每一步输出 CSV、日志、代码和审计记录;Word 报告里的表格数字必须能回到执行文件。
默认关闭;启用后只在基准回归后做规格敏感性候选搜索,并记录原始规格、候选、采纳门槛和失败原因。
多文件不是简单 concat。系统会记录输入、键值、行数变化、匹配率、重复键、缺失码、类型转换和清洗后的 lineage, 让后续回归知道样本是怎么来的。
支持 append、跨年 harmonize append、aggregate 后 merge、one-to-one / many-to-one 校验、左右键名不同的合并、reshape long/wide。
新增批量重命名、键值标准化、显式缺失码转空、类型转换、按键去重;已有缩尾、分组缩尾、异常值、插补和 codebook 清洗规则。
每个 prepare plan 生成 JSON、JSONL audit、变量 harmonization 表和 lineage;合并膨胀、重复键、未匹配键会被记录或阻断。
系统把正式实证论文最容易被追问的部分前置成产品约束:变量定义、模型设定、表格数字、稳健性边界、显著性优化披露、保密交付和复现材料。
面向提交、复核和复现三种场景分别组织内容,避免把内部调参、失败日志、敏感数据说明和教师审阅版混在一起。
按论文结构组织变量定义、模型设定、描述统计、基准结果、稳健性、扩展分析与结论。
列出代码审计、规格搜索、失败步骤、方法学风险和下一步建议,供作者和导师复核。
打包 .do/.py/.R、CSV、图片、日志和复现说明,在授权范围内回溯每个结果。
方法层不是让 AI 临场写代码,而是把常用模型做成稳定模板,并在报告侧加入对应的论文写法、适用前提和诊断边界。
| 类别 | 已覆盖方法 |
|---|---|
| 基础与诊断 | 数据清洗、描述统计、相关系数、VIF 共线性、Hausman、残差诊断、基准回归、稳健性、安慰剂、异质性、中介、机制、调节效应。 |
| 因果识别 | DID、DDD、交错 DID、Sun-Abraham、de Chaisemartin、Borusyak DID imputation、Honest DID、合成控制、Synthetic DID、RDID、Spatial DID、RDD、PSM、IPW、IPWRA、CEM、熵平衡、DML、因果森林。 |
| 面板与时序 | 固定效应、动态面板 system GMM、面板 IV、Hausman-Taylor、Driscoll-Kraay、Newey-West、Conley HAC、面板单位根、Pesaran CD、MG/PMG、VAR、VECM、ARIMA、GARCH、SVAR、HP/BK 滤波、结构断点和 Chow 检验。 |
| 模型族 | Logit/Probit、多分类/有序选择、Tobit、Heckman、ZIP/ZINB、Poisson/负二项、PPML、分位数/面板分位数、门槛、空间计量、SUR/3SLS、多层混合效应、Oaxaca-Blinder、Meta-analysis、复杂抽样 svy。 |
| 问卷与结构模型 | Cronbach α、EFA、CFA、Harman 单因素、SEM/路径分析、多重插补、Theil/Gini 不平等分解、局部多项式非参回归、贝叶斯基准回归。 |
替换变量测度、增减控制变量、缩尾/截尾/异常值、固定效应、聚类/HAC/Bootstrap 标准误、滞后与非线性、样本窗口、外生冲击期剔除、模型替换、交互项、动态项、分组/随机半样本、Permutation、Romano-Wolf 和 GMM 候选。
默认关闭;只在基准回归步骤触发。已达用户阈值会跳过,信号过弱会跳过;采纳结果要经过方向一致、结构合理、审计可解释的门槛。
提交版、内部审计版、规格敏感性版和复现包分开组织。启用优化时会保留原始结果、候选搜索结果和采用/未采用原因。
上传 CSV、DTA 或 XLSX,确认变量设计后即可进入完整实证管线。敏感研究可咨询私有化部署,数据和报告留在指定环境。