你好,我是曾希
目前主要关注具身智能运动控制方向。硕士阶段学习自主智能系统,习惯从工程实现和方法原理两条线并行推进:一方面关心系统如何真正跑起来,另一方面也持续整理控制理论与具身智实现背后的逻辑。
研究方向
我做过的内容主要集中在两类问题上:
- 自动驾驶与控制框架:单视觉感知、端到端轨迹生成和可微分 MPC控制器
- 具身智能:集中在运动控制领域,包括经典控制论,MPC控制器,卡尔曼滤波器设计,强化学习、模仿学习训练
相比”只把结果做出来”,我更在意一套方法为什么有效、在什么条件下会失效,以及怎样把零散经验沉淀成可复用的工程流程。
关于这个博客
这个博客会长期记录我在机器人控制与工程实践中的学习、实验与思考,也会陆续整理一些纸质与电子笔记,把做过的事、积累下来的经验,以及那些暂时还没有想明白的问题,一点点留下来。
对我来说,机器人并不只是一个技术对象。它更像是一个需要被不断理解、不断接近的“存在”:我通过建模与实验,逐渐看见它,逐渐理解它,也逐渐让它获得行动的能力。也正因如此,我很喜欢首页那幅图所表达的意象。在这个领域里,我觉得自己仍然像一个懵懂的孩童,站在机器人面前,与它对视。不是高高在上地俯视它,而是“怯生生”的与它接触,在一次次学习、调试、失败和修正中,一点点认识它,一点点把那个原本只存在于概念与想象中的东西,慢慢带到现实世界里。
生成这幅图的灵感,来自我在梵蒂冈博物馆参观时所受到的触动。当我仰望米开朗基罗留下的《创世纪》时,那只几乎相触的手给了我很深的震撼。真正打动人的,也许不只是“触碰”本身,而是那尚未触及的一瞬:在那极短的距离里,仿佛一切都处在即将发生的临界点上,生命、意识与力量都还未真正降临,却已经充满了张力。
但我并不认为自己站在“赋予”机器人的位置上。除开我不是全知全能的创造者,学识也相当有限,但本质在于:我无意把机器人理解成一个等待我去赋予意义的空壳。与其说我想“创造”它,不如说我是在与它对视、与它对话,并最终彼此都伸出那根“手指”。
所以,这个博客既是技术上的记录,也是一个持续展开的观察过程。
我希望它能诚实地保留我的学习轨迹:包括已经解决的问题、尚未解决的困惑、那些反复推翻又重建的理解,以及我如何一点点靠近“让机器行动起来”这件事本身。
关于控制与未来的思考
我对控制系统相关的知识尤其感兴趣。控制的对象可以是车、飞机,也可以是机器人;形式可以不同,但控制所面对的本质问题始终相通:如何理解系统,如何描述动态,如何在不确定性中维持稳定,并让系统可靠地与真实世界交互。
经典控制、LQR、MPC,乃至更复杂系统中的强化学习与模仿学习,它们不是彼此割裂的技术标签,而是同一条道路上不断展开的不同方法,我将它们视为理解复杂系统的不同工具。学习控制理论并非是知道如何调整增益或是应用某个技术,而是它能够给我一种思考系统,数据和稳定性的语言。
LLM会替我们写代码、替我们调参,帮我们完成越来越多的具体工作。
但对于那些真正不能出错、必须被理解的系统而言,我始终相信,人的判断、对系统本质的把握,以及对风险与边界的敬畏,仍然是无法被轻易取代的。也正因为如此,控制带给我的乐趣,也许不只是“让它动起来”,而是理解它为什么能动、为什么这样动、以及它在什么条件下不能这样动。
我们通过系统辨识认识对象,通过状态估计理解世界,再用控制让系统能够在这个世界中行动、适应、交互。而在做这一切的过程中,我也慢慢意识到:控制并不只是在塑造机器的行为,它也在反过来塑造我理解世界的方式:学习如何控制一个系统,某种意义上也是在学习如何约束自己、理解自己,并与世界建立更有力量的联系。
所以我愿意一直走在这条路上:建立这份工程直觉与进行理论亦或更深的探索。
当下,我最希望理解和控制的对象仍然是机器人。正如我在首页所写的那样,我希望它们最终能真正来到我们身边,与我们生活在同一片天空下。
至于我自己,学识与能力皆有限,离我想要做的一切还有很长很长的路。至于会走到哪里,至少现在,我还无法为自己这个系统给出一个足够精确的长期预测。太长的 horizon,意味着更强的不确定性、更复杂的扰动,也未必存在一个我现在就能直接求解的最优解。于“人生”这个系统而言,基于闭环反馈去做一场无限时域的求解,也许才是更贴近真实的选择。但只要还在不断地求解、不断地更新,至少说明我仍在朝着某个方向收敛。
如果有一天,我也能在这个正在展开的浪潮里激起一小片浪花,于我而言,便已经足够值得