资讯

当完成那些研究以后,卢宗青意识到“当前的多模态模型缺乏与世界交互的能力”。因为模型缺少学习物理交互的数据, 所以我们看到的那些泛化的能力本质都是“抽象”的,它终究无法理解动作和世界的关系,自然也无法预测世界。