项目驱动阅读索引

如果你希望“边学边做”，可按下面项目路径选择章节，而不是线性通读全书。

路径 A：两周最小可运行 VLA（仿真优先）

目标：完成一个“图像 + 文本指令 -> 动作”的最小闭环 demo。
必读章节：0.1 -> 1.1 -> 2.1 -> 2.4 -> 5.3 -> 6.1 -> 7.1 -> 8.1 -> 8.4 -> 11.1。
交付物：
能运行的训练脚本。
一段演示视频。
一页实验记录（成功率、失败案例、下一步改进）。

路径 B：强化学习微调路线

目标：在已有 BC 策略基础上做 RL 微调并对比效果。
必读章节：1.2 -> 1.3 -> 5.1 -> 5.2 -> 5.4 -> 9.3 -> 10.2 -> 10.3。
交付物：
BC vs RL 的指标对比表。
奖励设计文档。
至少一个失败案例复盘。

路径 C：系统部署与评测路线

目标：把模型接入机器人软件栈并建立评测协议。
必读章节：6.2 -> 6.4 -> 9.4 -> 10.1 -> 10.2 -> 10.3 -> 10.4 -> 11.2。
交付物：
延迟预算表与部署架构图。
安全策略清单（限幅、急停、回退机制）。
一次完整评测报告。

路径 D：论文复现与研究入门路线

目标：完成一篇 VLA 论文的小规模复现并写技术报告。
必读章节：0.2 -> 1.4 -> 2.2 -> 4.3 -> 8.5 -> 9.1 -> 11.2 -> 11.3 -> 11.4。
交付物：
可复现实验配置。
论文-代码映射表。
一份 6-10 页复现实验报告。

路径 E：长期能力建设（3-6 个月）

目标：形成“理论 + 工程 + 研究表达”的稳定能力结构。
必读章节：全书按 0 -> 12 顺序学习；每章完成“本章小结与自测”。
每月里程碑：
第 1 月：数学、深度学习、机器人基础。
第 2 月：VLA 架构与训练范式。
第 3 月：部署评测与研究报告。

项目执行模板

每个项目都建议固定输出下面四项：

假设：你认为哪个改动会提升什么指标。
实验：你实际改了什么、如何跑。
结果：核心指标和关键可视化。
结论：下一轮要保留/放弃什么。