项目
研究项目
我在宾夕法尼亚大学 xLab 从事研究,方向是将学习方法引入最优控制,具体涵盖求解器加速、动力学建模与优化问题结构设计,应用场景以安全关键系统为主。
混合整数非线性规划的学习加速框架(2025 至今)
MINLP 广泛出现于混杂动力系统与带安全约束的控制问题中,但其组合爆炸特性使实时求解几乎不可行——学习方法的优势在于能够跨问题实例摊销求解代价。
提出 L2O-MISQP 框架,将神经网络嵌入信赖域 MISQP 求解器,加速复杂 MINLP 的在线求解。
设计了基于可微优化层的端到端混合训练流程。
投稿中。
关键词: MINLP、学习优化、可微优化、信赖域方法
混合整数 MPC 的混合学习优化(2025)
MPC 每步都需重新求解一个 MIQP;这类参数化问题在时间维度上具有强结构相似性,这使得神经网络预测整数热启动解成为可能——在保证可行性的同时大幅压缩求解时间。
针对参数化 MIQP,提出了混合学习优化框架以加速混合整数 MPC。
将神经整数预测、可微 QP 层与有监督/自监督损失整合为统一训练框架,同步优化可行性与最优性。
已被 Learning for Dynamics and Control(L4DC)2025 录用。 [arXiv]
关键词: 可微优化、MIQP、学习优化、MPC
高斯过程动力学与 MPPI 控制(2025)
纯物理模型在工况漂移时精度下降;GP 残差学习可在线补偿模型偏差,但其有效性高度依赖不确定性估计的质量。
基于 F1TENTH 实车数据训练 GP 动力学模型,并将预测不确定性纳入 MPPI 控制框架。
系统考察了不同模型失配程度下 GP 残差修正的效果,厘清了学习补偿改善性能与引发不稳定的边界条件。
关键词: 高斯过程回归、不确定性感知控制、MPPI、贝叶斯学习
自主系统
BeamNG 车辆 MPC 控制器(2026 至今)
仿真到实机的迁移本身就是一个难题;BeamNG 的高保真闭环环境可在硬件部署前充分暴露规划与控制算法的边界情况。
在 BeamNG 中搭建了面向轨迹跟踪与高速自主驾驶的完整控制流程。
实现并评估了 LTV-MPC 跟踪人类驾驶航点的效果,在 Spa 赛道上达到人类圈速的 80%。
进行中:在同一环境下搭建基于 Actor-Critic 强化学习的 DiffMPC 与 Vanilla MPPI 方案。
代码:GitHub - MPC
关键词: MPC、LTV-MPC、自主驾驶、强化学习、DiffMPC
F1TENTH 自主竞速(2025)
基于 ROS 2 搭建了涵盖感知、规划与控制的完整自主赛车系统。
- 规划与控制
- 实现了墙壁跟随、间隙跟随、纯追踪与 MPC 控制器,集成动态避障与赛线优化。
- 感知
- 开发了基于 LiDAR 的定位方案与基于视觉的车辆检测模块。
- 比赛成绩
- 完成两场计时赛与一场对抗赛的硬件实车部署。
- 第一场计时赛排名第一;全班首支实现无显示器实车部署与实时在线调试的队伍。
工具: ROS 2、Python、C++
关键词: 自主竞速、运动规划、感知、MPC、嵌入式机器人
基于 LLM 的 F1TENTH 自然语言导航(2025)
自然语言是普通用户最直接的交互方式——核心问题在于如何将语义层面的意图可靠地落地为底层可执行的控制原语。
构建了基于大语言模型的任务规划器,将自然语言指令解析并映射为驾驶原语。
融合符号推理与经典控制,支持交互式自主导航任务。
在仿真环境与真实 F1TENTH 平台上完成了端到端验证。
关键词: LLM 机器人、任务规划、自主驾驶
经典控制与基础学习
四旋翼控制论文复现(2025)
复现了基于级联姿态与位置控制器的非线性四旋翼控制系统。
分析了模型参数不确定性与外部扰动下的鲁棒性表现。
实现了简单网格规划器与用于轨迹生成的传感器融合模块。
工具: Python
街景图像地理坐标回归(2024)
以视觉 Transformer 为回归主干,从街景图像中预测地理坐标,并与传统特征匹配方法进行了系统对比。
关键词: 视觉 Transformer、地理定位、回归
