符号表（Notation）

本表汇总全书最常见符号，便于跨章节阅读时快速查找。

符号	含义	常见章节
$\mathbf{x}, \mathbf{y}$	向量	1.1, 2.1
$A, B, W$	矩阵 / 权重矩阵	1.1, 2.x
$\|\mathbf{x}\|$	向量范数	1.1
$A^\top$	矩阵转置	1.1
$A^{-1}$	矩阵逆	1.1, 6.1
$\lambda$	特征值 / 系数	1.1, 5.x
$\sigma$	奇异值 / 标准差	1.1, 1.2
$\mu$	均值 / 策略参数符号	1.2, 5.2
$\Sigma$	协方差矩阵	1.2
$\mathbb{E}[\cdot]$	期望	1.2, 5.x
$\mathrm{Var}(X)$	方差	1.2
$P(A\mid B)$	条件概率	1.2
$D_{KL}(P\|Q)$	KL 散度	1.2, 9.x
$\theta$	模型参数	1.3, 2.x, 9.x
$L(\theta)$	损失函数	1.3, 2.x
$\nabla_\theta L$	对参数的梯度	1.3, 2.x
$H$	Hessian 矩阵	1.3
$\eta$	学习率	1.3, 2.2
$f_\theta(\cdot)$	参数化模型	1.4, 2.x
$Q, K, V$	Attention 的 Query/Key/Value	2.4, 8.x
$d_{\text{model}}$	Transformer 隐藏维度	2.4, 2.5
$\pi_\theta(a\mid s)$	策略函数	5.x, 9.x
$V^\pi(s)$	状态价值函数	5.1, 5.2
$Q^\pi(s,a)$	动作价值函数	5.1, 5.2
$A^\pi(s,a)$	优势函数	5.2
$\gamma$	折扣因子	5.1, 5.2
$r_t$	时刻 $t$ 的奖励	5.x
$G_t$	折扣回报	5.x
$s_t, a_t, o_t$	状态、动作、观测	5.x, 8.x, 9.x
$\tau$	轨迹（trajectory）	5.x, 7.x, 9.x
$q, \dot{q}, \ddot{q}$	关节位置、速度、加速度	6.1, 6.2
$M(q), C(q,\dot{q}), G(q)$	机器人动力学项	6.2
$J(q)$	雅可比矩阵	6.1, 6.2
$T, R, \mathbf{p}$	齐次变换、旋转、平移	6.1
$x$	语言指令 / 文本条件	4.x, 8.x
$I$	图像输入	3.x, 8.x
$c$	条件变量（任务/机器人）	8.x, 9.x
$\mathcal{D}$	数据集	1.4, 7.x, 9.x
$\mathcal{L}_{\text{BC}}$	行为克隆损失	5.3, 9.2
$\mathcal{L}_{\text{RL}}$	强化学习损失	5.2, 9.3
$\alpha$	权重系数 / 熵温度	5.2, 9.x
$\epsilon$	小常数 / PPO clip 范围	2.2, 5.2
mAP / IoU	检测评测指标	3.1, 10.2
SR / SPL	任务成功率与路径效率指标	10.2

使用建议

遇到不认识的符号，先查本表，再回到章节上下文确认定义。
同一符号在不同章节可能含义不同（如 $\alpha$、$\lambda$），以本节定义为准。
复现实验时建议在代码注释中复用本表术语，减少沟通歧义。

Keyboard shortcuts

Robotic Embodied Intelligence - From Zero to Hero

符号表（Notation）

使用建议