符号表(Notation)
本表汇总全书最常见符号,便于跨章节阅读时快速查找。
| 符号 | 含义 | 常见章节 |
|---|---|---|
| $\mathbf{x}, \mathbf{y}$ | 向量 | 1.1, 2.1 |
| $A, B, W$ | 矩阵 / 权重矩阵 | 1.1, 2.x |
| $|\mathbf{x}|$ | 向量范数 | 1.1 |
| $A^\top$ | 矩阵转置 | 1.1 |
| $A^{-1}$ | 矩阵逆 | 1.1, 6.1 |
| $\lambda$ | 特征值 / 系数 | 1.1, 5.x |
| $\sigma$ | 奇异值 / 标准差 | 1.1, 1.2 |
| $\mu$ | 均值 / 策略参数符号 | 1.2, 5.2 |
| $\Sigma$ | 协方差矩阵 | 1.2 |
| $\mathbb{E}[\cdot]$ | 期望 | 1.2, 5.x |
| $\mathrm{Var}(X)$ | 方差 | 1.2 |
| $P(A\mid B)$ | 条件概率 | 1.2 |
| $D_{KL}(P|Q)$ | KL 散度 | 1.2, 9.x |
| $\theta$ | 模型参数 | 1.3, 2.x, 9.x |
| $L(\theta)$ | 损失函数 | 1.3, 2.x |
| $\nabla_\theta L$ | 对参数的梯度 | 1.3, 2.x |
| $H$ | Hessian 矩阵 | 1.3 |
| $\eta$ | 学习率 | 1.3, 2.2 |
| $f_\theta(\cdot)$ | 参数化模型 | 1.4, 2.x |
| $Q, K, V$ | Attention 的 Query/Key/Value | 2.4, 8.x |
| $d_{\text{model}}$ | Transformer 隐藏维度 | 2.4, 2.5 |
| $\pi_\theta(a\mid s)$ | 策略函数 | 5.x, 9.x |
| $V^\pi(s)$ | 状态价值函数 | 5.1, 5.2 |
| $Q^\pi(s,a)$ | 动作价值函数 | 5.1, 5.2 |
| $A^\pi(s,a)$ | 优势函数 | 5.2 |
| $\gamma$ | 折扣因子 | 5.1, 5.2 |
| $r_t$ | 时刻 $t$ 的奖励 | 5.x |
| $G_t$ | 折扣回报 | 5.x |
| $s_t, a_t, o_t$ | 状态、动作、观测 | 5.x, 8.x, 9.x |
| $\tau$ | 轨迹(trajectory) | 5.x, 7.x, 9.x |
| $q, \dot{q}, \ddot{q}$ | 关节位置、速度、加速度 | 6.1, 6.2 |
| $M(q), C(q,\dot{q}), G(q)$ | 机器人动力学项 | 6.2 |
| $J(q)$ | 雅可比矩阵 | 6.1, 6.2 |
| $T, R, \mathbf{p}$ | 齐次变换、旋转、平移 | 6.1 |
| $x$ | 语言指令 / 文本条件 | 4.x, 8.x |
| $I$ | 图像输入 | 3.x, 8.x |
| $c$ | 条件变量(任务/机器人) | 8.x, 9.x |
| $\mathcal{D}$ | 数据集 | 1.4, 7.x, 9.x |
| $\mathcal{L}_{\text{BC}}$ | 行为克隆损失 | 5.3, 9.2 |
| $\mathcal{L}_{\text{RL}}$ | 强化学习损失 | 5.2, 9.3 |
| $\alpha$ | 权重系数 / 熵温度 | 5.2, 9.x |
| $\epsilon$ | 小常数 / PPO clip 范围 | 2.2, 5.2 |
| mAP / IoU | 检测评测指标 | 3.1, 10.2 |
| SR / SPL | 任务成功率与路径效率指标 | 10.2 |
使用建议
- 遇到不认识的符号,先查本表,再回到章节上下文确认定义。
- 同一符号在不同章节可能含义不同(如 $\alpha$、$\lambda$),以本节定义为准。
- 复现实验时建议在代码注释中复用本表术语,减少沟通歧义。