

首次公开亮相直播访谈节目,作为英伟达Omniverse与物理AI高级总监,与光轮智能CEO谢晨,以及光轮智能增长负责人穆斯塔法一起,对“如何缩小机器人在虚拟与现实之间的差距”展开深刻探讨。
光轮智能是一家专注于仿真合成数据技术的公司。和专注于大模型的企业不同,他们的核心目标是帮助AI更好地理解和进入物理世界。目前主要聚焦于具身智能和无人驾驶两大场景。
访谈一真正开始,主持人Edmar Mendizabal(Omniverse社区经理)就开门见山抛出了一个许多人都很好奇的问题。
Madison解答道,英伟达内部很多项目都依赖于光轮智能的支持。例如,Gear Lab正在构建通用智能体模型,西雅图机器人实验室正在开展大量涉及接触操作和精密装配的任务。
对语言模型的研究人员来说,他们能够利用整个互联网的数据去训练LLM。但对机器人领域来说,情况却完全不同,他们必去手动采集数据,这也是为何会有那么多数据采集工厂的出现。
在这种缺乏数据的情况下,英伟达认为,仿真就是解决方案,因此就需要一个合成数据工厂,同时也希望合作伙伴认同OpenUSD的愿景,将其作为构建仿真就绪资产(SimReady Assets)的基础。
2023年,光轮智能成立了,目标是利用合成数据和仿真来突破机器人数据瓶颈。
有意思的是,谢晨以前就是英伟达无人驾驶仿真负责人,兜兜转转,现在又在为英伟达工作了。
接下来,主持人又问道:“那现在机器人从虚拟到现实(Sim2Real)还存在哪一些问题。”
对于无人驾驶来说,Sim2Real是最容易解决的,因为它主要依赖视觉感知。而对于机器人来说,一切都涉及物理接触,最重要的是操作能力(manipulation)。同时,它还需要灵巧手和触觉传感器配合使用,因此问题变得更复杂。
以冰箱为例,当你拉开门时,会感觉到磁吸密封条产生的力的作用,还有拉抽屉时会感觉到多重摩擦,这些物理特性都非常精确。
他认为,要让具身智能真正部署到现实世界需要消耗巨量的数据,实际上比大型语言模型所需的数据还要多。这就形成了一个巨大的数据障碍,而现实世界数据无法完全解决这一个问题。
他们借助了大量物理设备来收集精确的数据,并将其实现到仿真环境中。同时,他们还设计了一些方式去对比真实世界中的力和仿真中的力,以确保二者匹配。
他提到,强化学习很重要,但要运行大规模强化学习,就必须确保不一样的仿真在计算上非常高效。
为了让大量仿真环境同时运行,他们用简单又高效的方法(如基本几何体和凸包)来检测碰撞,这样既能保持充足准确,又能节省大量计算资源。
之后,谢晨还讲到了电缆仿真。电缆既像柔性物体,但又在某些情况下又表现得像刚体,所以它的仿真其实非常困难。
为了让机器人学习怎么样操作电缆,光轮智能与Newton及英伟达合作,为电缆构建求解器,并研发仿真就绪资产来构建这种仿真。
例如,让机器人在仿真中切割黄瓜是十分艰难的,这不单单是为了数据采集,更重要的是要支持强化学习。
最后,谢晨提到,光轮智能还在与英伟达共同构建Isaac Lab Arena——一个面向下一代基准测试、评估数据收集和大规模强化学习的框架平台,该项目已在CoRL大会上由英伟达正式发布。
2020年加入英伟达最初担任市场营销实习生,实习四个月后成为了Omniverse部门的活动营销经理,之后一直在该部门任职。
Madison在英伟达一路担任了产品营销经理、高级产品营销经理等职务,直到今年3月成为高级总监。
2012年,她在美国烹饪学院取得了烹饪艺术工商管理学士学位,之后到蓝带厨艺学院学习制作甜点以及葡萄酒,并曾在纽约和旧金山担任厨师。
2015年,Madison重新再回到巴黎,加入奢侈品行业,在LVMH公司担任市场营销与开发经理。在LV工作期间,Madison还学习了伦敦政治经济学院有关数据科学的短期课程。
之后,她于2021年取得了伦敦商学院的MBA学位,彼时她已经是英伟达的正式员工。
同样“承袭父业”的,还有Madison的哥哥Spencer,中文名黄胜斌,今年35岁。
前面介绍Madison时说过,兄妹二人曾一同参加MIT的短期AI高管课程,不过Spencer还额外多读了关于人机交互的课程。
之后,Spencer先是到哈佛商学院读了短期课程,之后也读了MBA,不过是在纽约大学,2022年取得学位。
2012年,Spencer在美国最大的私立艺术与媒体学院——芝加哥哥伦比亚学院本科毕业,主修国际市场和文化研究两个方向。
毕业后,老黄让他专门“回老家”学了一年中文,就是在最近一段时间,Spencer创立了他的鸡尾酒酒吧——R&D Cocktail Lab,而且一干就是八年。
据悉,这家酒吧屡获国际大奖,并曾入选亚洲50佳酒吧,不过目前谷歌地图显示该酒吧已经永久停业。
