AI-Assisted Research Workflow
摘要
本文档总结自某篇分享笔记,属于一套基于大语言模型(LLM)深度介入的科研工作流。该方案主张将 AI 作为提升研发效率与自动化水平的辅助工具,而非科研决策的主体。核心理念是通过多模型交叉验证、工具调用协议(如 MCP)以及严格的上下文管理,实现从文献调研到代码复现、再到创新点验证的端到端高效串联,最终产出符合顶级学术会议标准的学术成果。
基础设施要求
- 核心推理模型:具备超大上下文窗口及高阶推理能力的 LLM,作为主控节点(Agent)。
- 算力资源:满足模型训练与实验验证需求的 GPU 集群。
- 领域专业知:研究者自身对课题的深度理解,这是掌控研究走向的核心壁垒。
标准化执行流程
1. 自动化文献调研与方向探索
- 执行逻辑:向主控 LLM 输入领域内的经典基准文献(Seed Papers)。利用模型的检索能力获取最前沿的关联工作,并输出结构化的文献综述(Literature Review)。
- 输出目标:启动 LLM 的“规划模式(Plan Mode)”,基于当前研究空白(Research Gap)生成初步的候选研究方向。
2. 方案可行性审查与交叉验证
- 执行逻辑:通过模型上下文协议(Model Context Protocol, MCP)调用专精于代码生成的模型(如 Codex),对第一步产出的候选方向进行技术审查。
- 输出目标:剥离“理论可行但工程实现难度过大/无开源生态支撑”的伪需求,利用不同架构模型的性能差异进行双向验证,确保方向的工程可行性。
3. 研究者背景对齐
- 执行逻辑:将研究者自身的知识图谱、技术栈储备及过往研究经历(Profile)作为上下文注入模型。
- 输出目标:通过定向检索与过滤,从可行方向中筛选出与研究者核心竞争力高度匹配的课题。此步骤为重中之重,需人工深度介入以完成最终的课题定型。
4. 基线架构复现与调试
- 执行逻辑:利用主控模型拉取并解析开源代码库,执行基准模型(Baseline)的复现工作。
- 异常处理:若主控模型在 Debug 环境中陷入逻辑死锁,立即切换至专用的 AI 编程环境(如 Cursor 或直接调用 Codex)进行异常排查与接管。
5. 原型验证与规模扩展
- 执行逻辑:在基线跑通的基础上,将核心创新点的数学表达与逻辑伪代码写入项目级的全局引导文件(详见下文《全局引导文件规范》)。
- 迭代路径:遵循敏捷开发原则,首先在小规模数据集(Toy Dataset)上验证概念原型(Proof of Concept, PoC),验证收敛后再逐步扩大参数量或数据规模(Scale up)。
6. 严苛评估与质量打磨
- 执行逻辑:对实验结果进行多维度的消融实验(Ablation Study)与对比分析。
- 输出目标:反复迭代打磨逻辑链条与实验数据,直至满足顶会的评审标准。避免过度依赖 AI 导致的同质化输出。
核心实践:全局引导文件的编写规范
在复杂的科研项目中,由于单次对话的上下文长度限制及 AI 固有的“遗忘”特性,在项目根目录维护一个全局的引导文件(如 claude.md、.cursorrules 或 .AI-prompt.md)是保持研发方向一致性的关键。
该文件充当了 AI 的“系统级记忆”与“行为准则”,确保每次代码提交或新任务下发时,模型都能锚定核心目标。
引导文件结构建议
建议将引导文件保持在 500-1000 Token 以内,采用模块化的 Markdown 格式,主要包含以下几个区块:
# [项目名称] AI 协同开发指南
## 1. 核心目标
* **研究命题**:简述本项目要解决的具体科研问题(例如:提出一种基于 XXX 的改进算法,以降低计算复杂度)。
* **创新点**:明确该项目区别于现有 Baseline 的 2-3 个核心不同点,防止 AI 提出偏离主线的修改。
## 2. 架构与技术栈
* **依赖环境**:明确使用的框架版本(如 PyTorch 2.0, Python 3.10)。
* **目录结构解析**:简要说明核心逻辑文件、数据加载文件、模型定义文件的存放位置,便于 AI 快速定位。
## 3. 编码规范与约束
* 要求所有新增的数学模块必须包含详细的注释和公式推导(LaTeX 格式)。
* 要求采用面向对象编程(OOP),模块间保持低耦合。
* **禁止事项**:例如“禁止修改 `dataset.py` 中的核心加载逻辑”、“未确认前禁止执行大规模文件删除”。
## 4. 进度追踪与当前焦点
* **已完成 (Completed)**:简述已跑通的模块(如:Baseline 已复现,精度达到 XX%)。
* **当前任务 (Current Task)**:[由开发者在此处动态更新] 明确当前需要 AI 协助解决的具体问题(如:排查 `loss.py` 中梯度消失的问题)。 AI-Assisted Research Workflow
https://ryanjxy123.github.io/post/share_somethings/somethings-fun/ai_work_stream/