项目驱动阅读索引
如果你希望“边学边做”,可按下面项目路径选择章节,而不是线性通读全书。
路径 A:两周最小可运行 VLA(仿真优先)
- 目标:完成一个“图像 + 文本指令 -> 动作”的最小闭环 demo。
- 必读章节:
0.1 -> 1.1 -> 2.1 -> 2.4 -> 5.3 -> 6.1 -> 7.1 -> 8.1 -> 8.4 -> 11.1。 - 交付物:
- 能运行的训练脚本。
- 一段演示视频。
- 一页实验记录(成功率、失败案例、下一步改进)。
路径 B:强化学习微调路线
- 目标:在已有 BC 策略基础上做 RL 微调并对比效果。
- 必读章节:
1.2 -> 1.3 -> 5.1 -> 5.2 -> 5.4 -> 9.3 -> 10.2 -> 10.3。 - 交付物:
- BC vs RL 的指标对比表。
- 奖励设计文档。
- 至少一个失败案例复盘。
路径 C:系统部署与评测路线
- 目标:把模型接入机器人软件栈并建立评测协议。
- 必读章节:
6.2 -> 6.4 -> 9.4 -> 10.1 -> 10.2 -> 10.3 -> 10.4 -> 11.2。 - 交付物:
- 延迟预算表与部署架构图。
- 安全策略清单(限幅、急停、回退机制)。
- 一次完整评测报告。
路径 D:论文复现与研究入门路线
- 目标:完成一篇 VLA 论文的小规模复现并写技术报告。
- 必读章节:
0.2 -> 1.4 -> 2.2 -> 4.3 -> 8.5 -> 9.1 -> 11.2 -> 11.3 -> 11.4。 - 交付物:
- 可复现实验配置。
- 论文-代码映射表。
- 一份 6-10 页复现实验报告。
路径 E:长期能力建设(3-6 个月)
- 目标:形成“理论 + 工程 + 研究表达”的稳定能力结构。
- 必读章节:全书按
0 -> 12顺序学习;每章完成“本章小结与自测”。 - 每月里程碑:
- 第 1 月:数学、深度学习、机器人基础。
- 第 2 月:VLA 架构与训练范式。
- 第 3 月:部署评测与研究报告。
项目执行模板
每个项目都建议固定输出下面四项:
- 假设:你认为哪个改动会提升什么指标。
- 实验:你实际改了什么、如何跑。
- 结果:核心指标和关键可视化。
- 结论:下一轮要保留/放弃什么。