打好基础，擅用工具

这一章的目标，是帮助新同学尽快建立一套可靠的科研底座：基础概念足够扎实，工具链足够顺手，日常工作足够可复盘。

为什么基础和工具要一起讲

AI 科研里，基础决定你能不能判断问题，工具决定你能不能持续推进问题。只会工具，容易把科研做成参数搜索；只讲基础，又容易在真实项目里推进太慢。

更好的状态是：用基础知识判断方向，用工具系统降低摩擦，用复盘机制积累经验。

基础能力清单

数学与建模

你不需要一开始就掌握所有数学细节，但必须能读懂模型假设、优化目标和评价指标。

线性代数：向量空间、矩阵分解、特征值、低秩表示。
概率统计：分布、估计、假设检验、置信区间、校准。
优化：梯度下降、正则化、约束优化、泛化误差。
机器学习：监督学习、表示学习、评估协议、数据泄漏。

编程与工程

科研代码不要求一开始像产品代码一样完整，但必须可运行、可复现、可定位问题。

熟练使用 Python、PyTorch、NumPy、pandas。
理解 Git 的分支、提交、回滚和协作流程。
能写清晰的实验配置、日志、随机种子和结果导出。
知道如何用最小脚本复现一个错误。

英文阅读与表达

AI 相关研究变化很快，英文论文、官方文档和开源仓库是一手信息源。

先读摘要、图表、方法框架和实验设置。
记录作者实际解决的问题，而不是只摘抄模型名字。
用自己的话复述 contribution、assumption、limitation。

工具链建议

每天都会用的工具

场景	推荐工具	用法重点
代码开发	VS Code / Cursor	项目级搜索、调试、Git 集成
环境管理	conda / uv / Docker	固化依赖，避免环境漂移
实验跟踪	W&B / MLflow / TensorBoard	记录配置、指标、模型产物
文献管理	Zotero	分组、标签、PDF 标注
笔记系统	Obsidian / Notion	主题索引、论文卡片、周复盘
AI 助手	ChatGPT / Claude / Copilot	解释、改写、生成检查清单

AI 工具的正确位置

AI 助手适合帮你降低认知摩擦，但不应该替代你的判断。

它适合做这些事：

把论文段落解释成更容易理解的版本。
帮你生成实验 checklist。
检查代码里的潜在 bug。
帮你把粗糙想法改写成更清楚的研究问题。

它不适合直接决定这些事：

你的研究问题是否重要。
baseline 是否公平。
结论是否被实验充分支持。
论文贡献是否足够成立。

入门训练路线

第一周：建立可运行环境

完成一套标准项目模板：环境安装、数据下载、训练脚本、评估脚本、结果导出、README。

第二周：复现一篇小论文

选择代码质量较好的论文，先跑通作者结果，再改动一个变量，观察结果是否符合预期。

第三周：形成实验记录习惯

每一次实验都记录：问题、假设、配置、结果、异常、下一步。不要只记录最终成功结果。

第四周：做一次组会汇报

汇报重点不是“我跑了什么”，而是“我试图验证什么，证据支持什么，还有什么不确定”。

常见误区

误区一：收藏很多工具，但没有稳定流程

工具越多，不一定效率越高。先把每天都会用的 3 到 5 个工具打磨顺手，再逐步扩展。

误区二：用大模型替代阅读

大模型可以辅助理解，但一手判断仍然来自论文原文、实验细节和你自己的推理。

误区三：实验结果没有上下文

一个数字本身没有意义。必须知道数据集、划分方式、评价指标、baseline、随机种子和训练预算。

最小可行工作流

用 Zotero 管理论文和标签。
用一个固定模板记录论文卡片。
用 Git 管理每次代码变化。
用配置文件管理实验参数。
用实验追踪工具保存指标和产物。
每周写一次复盘，明确下周最重要的问题。

下一步

读完这一章后，下一步应该进入科研工作流总览，把基础能力放进完整的选题、实验和写作流程里。

打好基础，擅用工具 ​

为什么基础和工具要一起讲 ​

基础能力清单 ​

数学与建模 ​

编程与工程 ​

英文阅读与表达 ​

工具链建议 ​

每天都会用的工具 ​

AI 工具的正确位置 ​

入门训练路线 ​

第一周：建立可运行环境 ​

第二周：复现一篇小论文 ​

第三周：形成实验记录习惯 ​

第四周：做一次组会汇报 ​

常见误区 ​

误区一：收藏很多工具，但没有稳定流程 ​

误区二：用大模型替代阅读 ​

误区三：实验结果没有上下文 ​

最小可行工作流 ​

下一步 ​