AI-Assisted Research Workflow

摘要

本文档总结自某篇分享笔记，属于一套基于大语言模型（LLM）深度介入的科研工作流。该方案主张将 AI 作为提升研发效率与自动化水平的辅助工具，而非科研决策的主体。核心理念是通过多模型交叉验证、工具调用协议（如 MCP）以及严格的上下文管理，实现从文献调研到代码复现、再到创新点验证的端到端高效串联，最终产出符合顶级学术会议标准的学术成果。

基础设施要求

核心推理模型：具备超大上下文窗口及高阶推理能力的 LLM，作为主控节点（Agent）。
算力资源：满足模型训练与实验验证需求的 GPU 集群。
领域专业知：研究者自身对课题的深度理解，这是掌控研究走向的核心壁垒。

标准化执行流程

1. 自动化文献调研与方向探索

执行逻辑：向主控 LLM 输入领域内的经典基准文献（Seed Papers）。利用模型的检索能力获取最前沿的关联工作，并输出结构化的文献综述（Literature Review）。
输出目标：启动 LLM 的“规划模式（Plan Mode）”，基于当前研究空白（Research Gap）生成初步的候选研究方向。

2. 方案可行性审查与交叉验证

执行逻辑：通过模型上下文协议（Model Context Protocol, MCP）调用专精于代码生成的模型（如 Codex），对第一步产出的候选方向进行技术审查。
输出目标：剥离“理论可行但工程实现难度过大/无开源生态支撑”的伪需求，利用不同架构模型的性能差异进行双向验证，确保方向的工程可行性。

3. 研究者背景对齐

执行逻辑：将研究者自身的知识图谱、技术栈储备及过往研究经历（Profile）作为上下文注入模型。
输出目标：通过定向检索与过滤，从可行方向中筛选出与研究者核心竞争力高度匹配的课题。此步骤为重中之重，需人工深度介入以完成最终的课题定型。

4. 基线架构复现与调试

执行逻辑：利用主控模型拉取并解析开源代码库，执行基准模型（Baseline）的复现工作。
异常处理：若主控模型在 Debug 环境中陷入逻辑死锁，立即切换至专用的 AI 编程环境（如 Cursor 或直接调用 Codex）进行异常排查与接管。

5. 原型验证与规模扩展

执行逻辑：在基线跑通的基础上，将核心创新点的数学表达与逻辑伪代码写入项目级的全局引导文件（详见下文《全局引导文件规范》）。
迭代路径：遵循敏捷开发原则，首先在小规模数据集（Toy Dataset）上验证概念原型（Proof of Concept, PoC），验证收敛后再逐步扩大参数量或数据规模（Scale up）。

6. 严苛评估与质量打磨

执行逻辑：对实验结果进行多维度的消融实验（Ablation Study）与对比分析。
输出目标：反复迭代打磨逻辑链条与实验数据，直至满足顶会的评审标准。避免过度依赖 AI 导致的同质化输出。

核心实践：全局引导文件的编写规范

在复杂的科研项目中，由于单次对话的上下文长度限制及 AI 固有的“遗忘”特性，在项目根目录维护一个全局的引导文件（如 claude.md、.cursorrules 或 .AI-prompt.md）是保持研发方向一致性的关键。

该文件充当了 AI 的“系统级记忆”与“行为准则”，确保每次代码提交或新任务下发时，模型都能锚定核心目标。

引导文件结构建议

建议将引导文件保持在 500-1000 Token 以内，采用模块化的 Markdown 格式，主要包含以下几个区块：

# [项目名称] AI 协同开发指南

## 1. 核心目标 
* **研究命题**：简述本项目要解决的具体科研问题（例如：提出一种基于 XXX 的改进算法，以降低计算复杂度）。
* **创新点**：明确该项目区别于现有 Baseline 的 2-3 个核心不同点，防止 AI 提出偏离主线的修改。

## 2. 架构与技术栈
* **依赖环境**：明确使用的框架版本（如 PyTorch 2.0, Python 3.10）。
* **目录结构解析**：简要说明核心逻辑文件、数据加载文件、模型定义文件的存放位置，便于 AI 快速定位。

## 3. 编码规范与约束 
* 要求所有新增的数学模块必须包含详细的注释和公式推导（LaTeX 格式）。
* 要求采用面向对象编程（OOP），模块间保持低耦合。
* **禁止事项**：例如“禁止修改 `dataset.py` 中的核心加载逻辑”、“未确认前禁止执行大规模文件删除”。

## 4. 进度追踪与当前焦点 
* **已完成 (Completed)**：简述已跑通的模块（如：Baseline 已复现，精度达到 XX%）。
* **当前任务 (Current Task)**：[由开发者在此处动态更新] 明确当前需要 AI 协助解决的具体问题（如：排查 `loss.py` 中梯度消失的问题）。