Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

项目驱动阅读索引

如果你希望“边学边做”,可按下面项目路径选择章节,而不是线性通读全书。

路径 A:两周最小可运行 VLA(仿真优先)

  1. 目标:完成一个“图像 + 文本指令 -> 动作”的最小闭环 demo。
  2. 必读章节:0.1 -> 1.1 -> 2.1 -> 2.4 -> 5.3 -> 6.1 -> 7.1 -> 8.1 -> 8.4 -> 11.1
  3. 交付物:
  4. 能运行的训练脚本。
  5. 一段演示视频。
  6. 一页实验记录(成功率、失败案例、下一步改进)。

路径 B:强化学习微调路线

  1. 目标:在已有 BC 策略基础上做 RL 微调并对比效果。
  2. 必读章节:1.2 -> 1.3 -> 5.1 -> 5.2 -> 5.4 -> 9.3 -> 10.2 -> 10.3
  3. 交付物:
  4. BC vs RL 的指标对比表。
  5. 奖励设计文档。
  6. 至少一个失败案例复盘。

路径 C:系统部署与评测路线

  1. 目标:把模型接入机器人软件栈并建立评测协议。
  2. 必读章节:6.2 -> 6.4 -> 9.4 -> 10.1 -> 10.2 -> 10.3 -> 10.4 -> 11.2
  3. 交付物:
  4. 延迟预算表与部署架构图。
  5. 安全策略清单(限幅、急停、回退机制)。
  6. 一次完整评测报告。

路径 D:论文复现与研究入门路线

  1. 目标:完成一篇 VLA 论文的小规模复现并写技术报告。
  2. 必读章节:0.2 -> 1.4 -> 2.2 -> 4.3 -> 8.5 -> 9.1 -> 11.2 -> 11.3 -> 11.4
  3. 交付物:
  4. 可复现实验配置。
  5. 论文-代码映射表。
  6. 一份 6-10 页复现实验报告。

路径 E:长期能力建设(3-6 个月)

  1. 目标:形成“理论 + 工程 + 研究表达”的稳定能力结构。
  2. 必读章节:全书按 0 -> 12 顺序学习;每章完成“本章小结与自测”。
  3. 每月里程碑:
  4. 第 1 月:数学、深度学习、机器人基础。
  5. 第 2 月:VLA 架构与训练范式。
  6. 第 3 月:部署评测与研究报告。

项目执行模板

每个项目都建议固定输出下面四项:

  1. 假设:你认为哪个改动会提升什么指标。
  2. 实验:你实际改了什么、如何跑。
  3. 结果:核心指标和关键可视化。
  4. 结论:下一轮要保留/放弃什么。