下面是对 6.2.1–6.2.4 的一版“书稿级”展开,你可以直接并入整本书的 LaTeX / Markdown 中使用。图片处我用占位说明好了,方便你后期统一风格。
6.2 机器人动力学与控制概述(承上启下小节)
在 6.1 中,我们已经从几何层面 刻画了机器人:给定关节角 \( q \),通过正运动学就能算出末端位姿;给定末端目标位姿,通过逆运动学就能求出一组关节角解。 这些内容只回答了一个问题:
“关节角度和末端位姿之间是什么几何关系?”
真正让机器人动起来,必须回答第二个问题:
“在有质量、惯性和重力的真实世界中,要产生这些运动,需要多大的关节力矩 \( \tau \)?”
这一问题的答案,就是机器人动力学方程 。在此基础上,我们才能讨论 PID 控制、阻抗控制以及高层策略如何与低层伺服环协同工作。
本节从关节空间动力学方程出发,逐步过渡到典型的低层控制方法(PID、位置/速度/力矩模式),再介绍与人类交互密切相关的阻抗/顺应控制,最后给出“低层控制器–高层策略”的分层结构视角,为 6.3 的任务建模与动作表示埋下伏笔。
6.2.1 关节空间动力学方程的基本形式
6.2.1.1 关节空间动力学方程的标准形式
对于一个 \( n \) 自由度的刚体串联机械臂,在假设各连杆刚体、关节理想(摩擦单独建模)的条件下,其关节空间动力学可以写成如下标准形式:(罗马大学诊断中心)
\[ M(q)\ddot{q} + C(q,\dot{q})\dot{q} + G(q) = \tau \]
其中:
- \( q \in \mathbb{R}^n \):关节位置(角度或位移)向量;
- \( \dot{q}, \ddot{q} \):关节速度、加速度;
- \( M(q) \in \mathbb{R}^{n\times n} \):惯量矩阵(inertia matrix),描述系统在配置 \( q \) 下的“有效质量”分布;
- \( C(q,\dot{q})\dot{q} \):科里奥利/离心项(Coriolis and centrifugal terms),与 \( \dot{q} \) 线性相关,反映关节相互耦合带来的“速度相关”惯性效应;
- \( G(q) \):重力项(gravity term),只与姿态 \( q \) 有关,表示为了平衡重力所需的关节力矩;
- \( \tau \in \mathbb{R}^n \):各关节执行器产生的总力/力矩(control input)。
在更完整的工程模型中,常常把关节摩擦、外界扰动和末端外力也显式纳入,比如写成:
\[ M(q)\ddot{q} + C(q,\dot{q})\dot{q} + G(q) + \tau_{\text{fric}}(\dot{q}) + \tau_{\text{ext}} = \tau \]
- \( \tau_{\text{fric}} \):粘性摩擦 + 底摩擦等;
- \( \tau_{\text{ext}} \):末端或连杆受到外力(例如人拉动机械臂)通过雅可比 \( J(q) \) 映射到关节空间的力矩:\( \tau_{\text{ext}} = J(q)^\top F_{\text{ext}} \)。
重要性质(后续控制设计会频繁用到):(罗马大学诊断中心)
-
\( M(q) \) 对称且正定: 对任意非零向量 \( x \),有 \( x^\top M(q) x > 0 \),这反映了系统动能总是正的。
-
\( M(q) \) 与 \( C(q,\dot{q}) \) 满足能量守恒相关的结构性质: 对任意向量 \( x \),有
\[ x^\top \big(\dot{M}(q) - 2C(q,\dot{q})\big) x = 0, \]
这个反对称性质在证明控制器稳定性(Lyapunov 分析、被动性)时很有用。
图 6.2-1 占位: 建议放一张“机械臂 + 动力学方程结构”的示意图:左侧是多关节机械臂,右侧是框图,标出 \( M(q) \)、\( C(q,\dot{q}) \)、\( G(q) \) 分支,显示 \( \ddot{q}, \dot{q}, q \) 进入这些模块,再汇总为关节力矩 \( \tau \)。
6.2.1.2 与单自由度系统的类比:各项物理含义
如果只看一个单自由度转动关节,忽略耦合,可以写成熟悉的形式:
\[ I \ddot{\theta} + b \dot{\theta} + \tau_g(\theta) = \tau \]
- \( I \):转动惯量;
- \( b\dot{\theta} \):粘性阻尼;
- \( \tau_g(\theta) \):重力产生的力矩。
这与高等物理中常见的“质量–阻尼–弹簧”系统 \( m\ddot{x}+b\dot{x}+kx = u \) 完全同构。 多自由度机械臂的动力学方程可以看作是这一单输入单输出系统在高维空间中的推广:
- \( M(q)\ddot{q} \):像“多维质量项”,不仅数值随姿态变化,而且不同关节之间有耦合(非对角元素);
- \( C(q,\dot{q})\dot{q} \):类似“速度相关的耦合阻尼”,在某些姿态下甚至会产生向心力矩(例如手臂挥动时需要额外力矩抵消离心效应);
- \( G(q) \):重力引起的静态偏置力矩,机械臂抬高越高,重力力矩越大。
用这种类比,初学者可以先在“一维弹簧–阻尼–质量”直觉上建立感觉,再推广到关节空间的矩阵形式。
6.2.1.3 拉格朗日法推导思路
如果要系统地从机械臂结构推导出 M, C, G 的具体表达,常用的是拉格朗日法(Euler–Lagrange formulation)。(罗马大学诊断中心)
基本步骤如下(这里是“看懂思路版”,详细推导可以放在附录或练习中):
-
选择广义坐标 \( q \) 对串联机械臂而言,关节角/位移正好就是约束完好的广义坐标。
-
写出动能 \( T(q,\dot{q}) \)
-
对每个连杆,考虑其质心速度和转动速度;
-
将线速度、角速度表示为 \( q \) 和 \( \dot{q} \) 的函数;
-
整个机械臂的动能为各连杆动能之和:
\[ T(q,\dot{q}) = \frac{1}{2}\dot{q}^\top M(q)\dot{q}. \]
-
-
写出势能 \(V(q)\)
- 通常是重力势能之和;
- 若存在弹簧等,还可加入其他势能项。
-
构造拉格朗日函数
\[ L(q,\dot{q}) = T(q,\dot{q}) - V(q). \]
-
套用 Euler–Lagrange 方程
\[ \frac{d}{dt}\left(\frac{\partial L}{\partial \dot{q}}\right) - \frac{\partial L}{\partial q} = \tau. \]
展开、整理后,自然得到
\[ M(q)\ddot{q} + C(q,\dot{q})\dot{q} + G(q) = \tau. \]
拉格朗日法的特点:
- 得到的是解析的符号表达式,便于分析系统性质(对称性、能量守恒、被动性等);
- 适合用来设计基于模型的控制器,如计算力矩控制(computed torque)、反馈线性化、阻抗控制等。
图 6.2-2 占位: “能量视角的动力学推导”示意图:上半部分是机械臂连杆示意,下半部分写出动能 \( T \) 和势能 \( V \) 的表达式,再用箭头指向 Euler–Lagrange 方程,最后得到 \( M(q), C(q,\dot{q}), G(q) \)。
6.2.1.4 牛顿–欧拉法推导思路
另一条常被工程使用的路径是牛顿–欧拉法(Newton–Euler formulation) 。它直接基于牛顿第二定律(线加速度与力)、欧拉方程(角加速度与力矩)来做递推计算 。(tomgra.folk.ntnu.no)
典型流程:
- 前向递推(forward recursion)
从基座开始,沿着机械臂链路递推每个连杆的:
- 角速度、角加速度;
- 质心线速度、线加速度。
- 后向递推(backward recursion)
从末端开始,按反方向递推每个连杆:
- 合力、力矩;
- 计算出作用在每个关节的反作用力矩,即所需的关节力矩贡献。
- 将所有链接递推结果综合起来,得到与拉格朗日法等价的动力学方程。
与拉格朗日法相比:
- 牛顿–欧拉法倾向于给数值形式(recursive numeric form),方便实时计算“给定 \(q,\dot{q},\ddot{q}\),求所需 \(\tau\)”(即** 逆动力学**),在实际控制与仿真中非常常用;
- 拉格朗日法则更偏向于理论分析和求解系统整体性质。
在现代机器人软件栈中,诸如 RBDL、Pinocchio 等动力学库一般都基于牛顿–欧拉递推及其拓展版本实现。
6.2.1.5 一个二维双连杆机械臂示例(直觉版)
考虑一个二维平面内的 2-link 机械臂(上臂 + 前臂),关节为肩、肘两个转动自由度 q_1, q_2 ,各连杆质量为 m_1, m_2 ,长度 l_1, l_2 。 在忽略摩擦的情况下,其动力学可写成:
\[ M(q)\ddot{q} + C(q,\dot{q})\dot{q} + G(q) = \tau,\quad q = \begin{bmatrix}q_1 \ q_2\end{bmatrix} \]
其中:
- \( M(q) \) 包含:
- 自身转动惯量 \( I_1, I_2 \);
- 由第二连杆质量引起的耦合项(比如当肘关节转动时对肩部力矩的影响);
- \( C(q,\dot{q}) \) 包含与 \( \dot{q}_1\dot{q}_2 \)、\( \dot{q}_2^2 \) 等项相关的科里奥利和离心力;
- \( G(q) \) 则是两节手臂在重力场中形成的力矩,例如当 \( q_1 \) 抬高时肩关节需要更大的力矩支撑整条手臂。
你可以把这个系统想象成“两个相连的摆锤”,只不过质量分布和惯性更复杂而已。
图 6.2-3 占位: 画一个平面 2-link 机械臂,在每个关节标出角度 \(q_1, q_2\),在各连杆标出质心、重力方向,并在关节标注 \(\tau_1, \tau_2\),帮助读者把公式与具体物理形象对应起来。
6.2.2 PID 控制与位置 / 速度 / 力矩控制模式
在有了动力学模型之后,一个自然的问题是:如何根据期望的轨迹 \(q_d(t)\) 生成关节力矩 \(\tau(t)\)?
最经典、也最广泛落地的做法,就是以 PID(比例–积分–微分)为核心的闭环控制结构。这一节先给出 PID 的直观解释,再说明工业机器人中常见的三种低层控制模式:位置控制、速度控制、力矩控制,以及它们的存在意义和适用场景。(mclab-me.pusan.ac.kr)
6.2.2.1 PID 控制的基本形式与直觉
对一个单关节来说,假设目标是跟踪期望角度 \(q_d(t)\),定义误差:
\[ e(t) = q_d(t) - q(t). \]
连续时间 PID 控制律可写为:
\[ u(t) = K_p e(t) + K_i \int_0^t e(\tau),d\tau + K_d \frac{de(t)}{dt}. \]
- 比例项(P):\( K_p e(t) \) 当前误差越大,输出越大,可以快速推动系统朝目标移动。\( K_p \) 越大,响应越快,但过大可能导致严重超调或震荡。
- 积分项(I):\( K_i \int e(\tau)d\tau \) 积累历史误差。若系统存在稳态偏差(例如重力或摩擦导致的恒定偏差),积分项能够自动“补偿”,把误差逼向 0。但积分过强会导致响应变慢甚至“积分饱和”(出现大幅超调)。
- 微分项(D):\( K_d \dot{e}(t) \) 对误差变化速度作出反应,有点类似预测未来趋势。误差变化快时,D 项会“刹车”,帮助抑制超调和震荡。但 D 项对噪声敏感,实际实现时常加入滤波。
在数字控制器中,PID 通常以离散形式 实现,比如用差分近似微分和积分,或者采用“增量式”PID 以避免积分漂移。
6.2.2.2 三种低层控制模式:位置、速度、力矩
在工业和服务机器人产品中,控制接口往往抽象为三种模式:
- 位置控制模式(Position Control) 控制器的输入:期望关节角 \(q_d\)(或轨迹 \(q_d(t)\));
内部:每个关节驱动器自带位置环(通常还有更内层的速度、电流环),通过 PID 等方法让实际角度 \(q\) 跟踪 \(q_d\);
输出给电机的是电流/电压,但对上层来说是透明的。特点:
- 对上层开发者非常友好,只需给出目标角度;
- 高度稳定、安全,一般具有软限位和速度限制;
- 但无法灵活控制关节施加的力,只能“尽力跟踪角度”。
- 速度控制模式(Velocity Control) 控制器的输入:期望关节速度 \(\dot{q}_d\); 内部:驱动器保证实际速度 \(\dot{q}\) 跟踪 \(\dot{q}_d\),位置不直接受控。应用:
特点:
- 移动机器人底盘(差速轮、全向轮):给定线速度/角速度;
- 连续旋转任务(如输送带驱动电机)。
- 适合“持续运动”的场景;
- 上层需要自己积分速度生成位置,对轨迹规划负责。
- 力矩(或电流)控制模式(Torque / Current Control) 控制器的输入:期望关节力矩 \(\tau_d\)(或等价的电机电流); 内部:只做电流/力矩闭环控制,基本不对位置/速度做显式闭环(当然也有安全限幅)。优点:
缺点:
- 给予上层最大自由度,可直接利用动力学模型设计精细的控制律(计算力矩控制、阻抗控制等);
- 可实现柔顺控制、人机交互等高级行为。
- 上层必须承担更多稳定性和安全性可靠性责任;
- 对模型精度和控制频率要求较高。
图 6.2-4 占位: 用层次框图展示“电流环(力矩)→ 速度环 → 位置环”三层结构,并用箭头说明:上层如果用位置控制,则实际上是通过嵌套的 PID 环间接控制电流;如果选用力矩模式,则直接绕过外层,站到最内层。
6.2.2.3 控制模式的适用场景与与动力学前馈的结合
综合来看,三种模式可以这样理解:
- 位置控制: “尽量把关节拉到这儿来”,对高精度定点、重复性轨迹 非常合适(典型工业机械臂焊接、搬运等)。
- 速度控制: “保持这样的速度走/转”,对导航、持续旋转设备、轮式机器人驱动 非常合适。
- 力矩控制: “产生这样大小的力矩/力”,适合需要与环境互动、需要柔顺性 的任务,例如协作机械臂、人机共抓重物、装配插销、打磨等。(MathWorks)
在力矩控制模式下,我们可以直接利用动力学方程设计所谓的计算力矩控制(Computed Torque Control)或反馈线性化控制:(mclab-me.pusan.ac.kr)
\[ \tau = M(q)v + C(q,\dot{q})\dot{q} + G(q), \]
其中 v 是一个新的“虚拟加速度”控制量,例如:
\[ v = \ddot{q}_d + K_v(\dot{q}_d - \dot{q}) + K_p(q_d - q), \]
代入动力学方程后,系统在理想模型下可化为:
\[ \ddot{q} = \ddot{q}_d + K_v(\dot{q}_d - \dot{q}) + K_p(q_d - q), \]
变成一组解耦的二阶线性系统,调 K_p, K_v 即可获得类似“二阶系统”的响应。这种“模型前馈 + PID 反馈”结构在理论上优雅,在工程上也十分常见。
6.2.3 阻抗控制与顺应性控制的直觉
单纯的“把手臂拉到某个位置”在许多任务中是不够的。比如:
- 把插头插入插座,需要在碰撞到边缘时让一点,而不是死命顶上去;
- 人推一下协作机器人手臂,希望它像一个带弹簧的物体那样略微退让,而不是僵硬不动或狂抖。
这类任务要求机器人不仅要跟踪轨迹,还要在碰到环境或人时呈现某种“机械特性”——像软弹簧?像硬杆?像带阻尼的弹簧?
阻抗控制(Impedance Control) 和顺应控制(Admittance Control) 正是为此而提出的交互控制 策略。它们都是从虚拟的“质量–弹簧–阻尼”模型出发,让机器人在接触中表现出可调的“硬/软”特性。(ScienceDirect)
6.2.3.1 阻抗控制:让末端“表现成弹簧–阻尼系统”
在力学中,“阻抗(impedance)”描述的是** 力–运动**之间的关系,例如力与速度、加速度的关系。对机器人末端(任务空间)坐标 x 来说,一个典型的二阶阻抗模型是:
\[ M_d(\ddot{x} - \ddot{x}_d) + D_d(\dot{x} - \dot{x}_d) + K_d(x - x_d) = F_{\text{ext}}, \]
其中:
- \(x, \dot{x}, \ddot{x}\):末端实际位置、速度、加速度;
- \(x_d, \dot{x}_d, \ddot{x}_d\):期望末端轨迹;
- \(F_{\text{ext}}\):环境对末端施加的外力(通过力/力矩传感器测得);
- \(M_d, D_d, K_d\):期望的虚拟质量、阻尼、刚度矩阵(通常设计为对角阵)。
含义可以这样理解:
- 没有外力时(\(F_{\text{ext}} = 0\)),末端会尽量跟踪 \(x_d\),偏差满足一个“虚拟质量–弹簧–阻尼”系统;
- 当环境施加外力时,末端偏离期望轨迹的程度由 \(M_d, D_d, K_d\) 决定:
- \(K_d\) 大 → 刚度高 → 末端更“硬”;
- \(K_d\) 小、\(D_d\) 足够 → 末端更“软”,容易在外力作用下产生位移但不会长时间震荡。
在实现上,阻抗控制通常在力矩控制模式 下工作:
-
用传感器测得 \(F_{\text{ext}}\);
-
在任务空间按上述方程计算期望的末端加速度/力;
-
通过雅可比 \(J(q)\) 把期望末端力转换成关节力矩命令:
\[ \tau = J(q)^\top F_{\text{cmd}} + \text{(可能的重力补偿等项)}. \]
很多关于“操作空间控制(operational space control)”的工作,都是在此基础上进一步通过 \(M(q)\) 和 \(J(q)\) 引入任务空间惯量,从而直接在末端空间设计控制律。(SAGE Journals)
图 6.2-5 占位: 画一个机械臂末端与环境接触的示意图,在末端画一个“虚拟弹簧–阻尼器”与环境相连,用箭头标注 K_d 、 D_d ,并用文本说明:“通过调节 K_d, D_d ,机器人末端的软硬度可调”。
6.2.3.2 顺应控制(Admittance Control):把力当作输入,输出运动
与阻抗控制相对的是顺应控制(Admittance Control) 。在电路类比中,阻抗是 V/I ,顺应(admittance)是其倒数 I/V ;在机器人里可以粗略地理解为:
- 阻抗控制:输入是位移/速度,输出是力(“不让你随便推”);
- 顺应控制:输入是外力,输出是位移/速度(“你推我我就动”)。(Ris)
典型的顺应控制结构如下:
-
力输入 由末端力/力矩传感器测到 \(F_{\text{ext}}\)。
-
虚拟质量–阻尼–刚度模型 在控制器中模拟一个虚拟物体,其动力学为:
\[ M_v \ddot{x}_{\text{cmd}} + D_v \dot{x}_{\text{cmd}} + K_v (x_{\text{cmd}} - x_d) = F_{\text{ext}}. \]
- \(x_{\text{cmd}}\):由控制器生成的“命令位置”;
- 上层位置/速度控制器把 \(x_{\text{cmd}}\) 作为目标。
-
位置/速度环执行 将 \(x_{\text{cmd}}(t)\) 转换为关节空间轨迹或速度命令,由底层位置/速度控制器(而非力矩控制器)执行。
顺应控制的优势在于:
- 适用于刚性很高、内环位置/速度控制较成熟的机器人(无需原生力矩控制接口);
- 在人机交互场景中,可以通过调节虚拟参数 M_v, D_v, K_v 轻松改变顺应性——例如让机械臂在被人牵引时表现得更轻、更柔软;
- 在工业中已有大量应用,例如外力协助的示教、协作手臂、康复机器人等。
6.2.3.3 阻抗 vs 顺应:物理直觉与应用场景
阻抗控制与顺应控制本质上都是在“形塑(shape)机器人与环境的交互动力学”。两者区别主要体现在实现方式和对硬件的要求上:(MathWorks)
- 阻抗控制(Impedance)
- 更自然搭配 力矩控制模式;
- 控制器直接输出期望力/力矩;
- 适合机器人本体柔软/关节具有一定顺应性的场景;
- 在硬环境(刚性治具、刚性工件)接触时表现更稳健。
- 顺应控制(Admittance)
- 更自然搭配 位置/速度控制模式;
- 控制器根据测得的外力计算期望位移/速度;
- 适合机器人本体刚度较高,但配有准确力传感器;
- 在与人或软体环境交互 时表现出良好的顺应性和安全性。
典型应用包括:
- 打磨/抛光:需要沿着工件表面以一定压力滑动,常采用阻抗控制来维持稳定接触力。
- 插接/装配:如插销入孔、插线、插 USB,阻抗/顺应控制允许末端在插入时自动“找孔”,而不是完全依赖几何精度。
- 人机协作:人牵着协作机器人手臂做示教,或人直接推机器人改变其轨迹,顺应控制可以让机器人像一个“有弹簧的助手”而不是一个“刚性机器”。
这一节中的思想,在后续更高级的 VLA 控制中仍然适用:高层策略可以输出期望的刚度/阻尼参数,而低层控制器(阻抗或顺应控制)负责把这些“行为风格”体现在物理交互中。
6.2.4 低层控制器 vs 高层策略的分层结构
至此,我们已经有了:
- 动力学模型 \( M(q), C(q,\dot{q}), G(q) \);
- 经典低层控制方法:PID、位置/速度/力矩模式;
- 交互控制方法:阻抗控制与顺应控制。
然而,一个完整的具身智能系统从感知–决策–控制 到执行往往结构复杂。实践中,人们通常采用一种分层控制架构:(MDPI)
- 低层控制器(Low-Level Controller):负责毫秒级的伺服、稳定性和安全;
- 高层策略(High-Level Policy/Planner):负责秒级甚至更长时间尺度的任务规划、策略决策——包括传统规划算法和基于 RL / VLA 的策略。
6.2.4.1 低层控制:高速伺服与安全守门员
低层控制通常包含以下内容:
- 电流/力矩环(kHz 级)
- 硬件驱动器内部,基于电流传感器调整 PWM;
- 实际频率可达几 kHz,用于精确实现力矩命令、快速抑制电机扰动。
- 速度环(几百 Hz)
- 计算当前速度误差 \(\dot{q}_d - \dot{q}\);
- 输出期望电流/力矩给电流环;
- 保证速度响应平滑,限制最大速度、加速度。
- 位置环(几十到几百 Hz)
- 计算位置误差 q_d - q ;
- 输出速度或力矩命令;
- 确保轨迹跟踪、软限位、安全停止。
这三层可以由同一控制器分时执行,也可以分布在驱动器 MCU 和主控工控机/嵌入式 CPU 上。它们共同的特点是:
高频率(例如 100–1000 Hz)、低延时、强安全约束。
无论高层算法是什么样(RL policy、VLA 模型、传统规划器),只要通过这些低层接口下发命令,就能在一定程度上保证机器人在物理层面不会“发疯”。
6.2.4.2 高层策略:任务规划与智能决策
高层策略可以来自多种来源:
- 传统的路径规划与轨迹优化 算法(RRT*, CHOMP、MPC 等),输出末端或关节轨迹;
- 任务级规划器(Task Planner),基于符号状态和动作描述生成“拿起 → 移动 → 放下”的高层动作序列;
- 深度强化学习策略(RL Policy),以状态(视觉 + 机器人状态)为输入,输出高层动作(如期望末端速度、期望关节速度,甚至期望阻抗参数);
- VLA 模型,将视觉 + 语言 + 动作建模在统一 Transformer 中,直接输出高层动作 token。
它们的共同点是:
- 决策频率较低,通常在 5 – 50 Hz;
- 输出的是更“抽象”的控制接口,如期望末端 pose、短时序列动作、目标轨迹片段等,而不是直接 PWM。
图 6.2-6 占位: 画一个“分层控制”框图:最上层是“语言指令 / 任务规划 / VLA 策略”,中间是“高层动作接口(末端目标、delta pose、速度命令、阻抗参数)”,最下层是“关节级伺服(PID、电流环) + 动力学模型”。用不同时间尺度标注各层频率(例如 10 Hz / 100 Hz / 1 kHz)。
6.2.4.3 分层结构的优势与与后续章节的衔接
采用分层结构有几个关键好处:(MDPI)
- 稳定性与安全性可控 低层控制闭环总是存在,并且由可靠的模型和经验设计保证稳定。高层策略即使有波动或短暂不稳定,低层也可以通过限幅、饱和、阻抗/顺应控制等手段进行“缓冲”。
- 复用性强 同一套低层控制器可以服务于不同高层算法:
只要接口一致,高层算法可以独立演化。
- 今天用传统规划;
- 明天换成 RL 策略;
- 后天接入 VLA 模型。
- 易于工程调试与分工 控制工程师可以专注于低层伺服和安全,AI/学习方向的研究者可以专注于高层策略和模型结构,两边通过清晰接口协作。
- 自然承接到 VLA 模型 在本书后续章节(尤其是第 8、9、10 章),VLA 模型通常扮演“高层策略”的角色:
- 输入:视觉观测、语言指令、机器人状态;
- 输出:末端位姿增量(Delta Pose)、关节速度命令、抓取/释放指令,甚至期望阻抗参数;
- 然后通过第 6 章介绍的低层控制与动力学执行到真实机器人上。
而第 6.3 节“任务建模与动作表示”会进一步细化高层策略输出的形式,比如关节空间轨迹 vs 末端轨迹、delta pose / velocity 命令、动作原语等,使“VLA 输出的动作”与“第 6.2 节介绍的低层控制接口”在概念上严丝合缝地对接起来。
这一整节从动力学方程到 PID、再到阻抗/顺应控制和分层结构,基本构成了“机器人低层控制”的核心框架。读者在掌握这些内容后,就可以比较从容地理解后面章节中 VLA 模型如何“站在低层控制肩膀上”,把高维感知和语言理解转化为可靠的物理行为。