Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

符号表(Notation)

本表汇总全书最常见符号,便于跨章节阅读时快速查找。

符号含义常见章节
$\mathbf{x}, \mathbf{y}$向量1.1, 2.1
$A, B, W$矩阵 / 权重矩阵1.1, 2.x
$|\mathbf{x}|$向量范数1.1
$A^\top$矩阵转置1.1
$A^{-1}$矩阵逆1.1, 6.1
$\lambda$特征值 / 系数1.1, 5.x
$\sigma$奇异值 / 标准差1.1, 1.2
$\mu$均值 / 策略参数符号1.2, 5.2
$\Sigma$协方差矩阵1.2
$\mathbb{E}[\cdot]$期望1.2, 5.x
$\mathrm{Var}(X)$方差1.2
$P(A\mid B)$条件概率1.2
$D_{KL}(P|Q)$KL 散度1.2, 9.x
$\theta$模型参数1.3, 2.x, 9.x
$L(\theta)$损失函数1.3, 2.x
$\nabla_\theta L$对参数的梯度1.3, 2.x
$H$Hessian 矩阵1.3
$\eta$学习率1.3, 2.2
$f_\theta(\cdot)$参数化模型1.4, 2.x
$Q, K, V$Attention 的 Query/Key/Value2.4, 8.x
$d_{\text{model}}$Transformer 隐藏维度2.4, 2.5
$\pi_\theta(a\mid s)$策略函数5.x, 9.x
$V^\pi(s)$状态价值函数5.1, 5.2
$Q^\pi(s,a)$动作价值函数5.1, 5.2
$A^\pi(s,a)$优势函数5.2
$\gamma$折扣因子5.1, 5.2
$r_t$时刻 $t$ 的奖励5.x
$G_t$折扣回报5.x
$s_t, a_t, o_t$状态、动作、观测5.x, 8.x, 9.x
$\tau$轨迹(trajectory)5.x, 7.x, 9.x
$q, \dot{q}, \ddot{q}$关节位置、速度、加速度6.1, 6.2
$M(q), C(q,\dot{q}), G(q)$机器人动力学项6.2
$J(q)$雅可比矩阵6.1, 6.2
$T, R, \mathbf{p}$齐次变换、旋转、平移6.1
$x$语言指令 / 文本条件4.x, 8.x
$I$图像输入3.x, 8.x
$c$条件变量(任务/机器人)8.x, 9.x
$\mathcal{D}$数据集1.4, 7.x, 9.x
$\mathcal{L}_{\text{BC}}$行为克隆损失5.3, 9.2
$\mathcal{L}_{\text{RL}}$强化学习损失5.2, 9.3
$\alpha$权重系数 / 熵温度5.2, 9.x
$\epsilon$小常数 / PPO clip 范围2.2, 5.2
mAP / IoU检测评测指标3.1, 10.2
SR / SPL任务成功率与路径效率指标10.2

使用建议

  1. 遇到不认识的符号,先查本表,再回到章节上下文确认定义。
  2. 同一符号在不同章节可能含义不同(如 $\alpha$、$\lambda$),以本节定义为准。
  3. 复现实验时建议在代码注释中复用本表术语,减少沟通歧义。